Honza Javorek

8 months ago

Honza Javorek
8 months ago

StackOverflow je prý mrtvé. No je pravda, že v poslední době, když tam jdu něco hledat, tak jsou tam otázky i odpovědi zpravidla 3, 5, nebo dokonce 10 let staré, ale aktuálnějšího často nic nenajdu 🫤 blog.pragmaticengineer.com/sta… #links

Stack overflow is almost dead

Today, Stack overflow has almost as few questions asked per month, as when it launched back in 2009. A recap of its slow, then rapid, downfall.

^{Gergely Orosz (The Pragmatic Engineer)}

#links

in reply to Honza Javorek

Jiří Eischmann

in reply to Honza Javorek 8 months ago

Vypadá to, že to umře stejně jako technické knihy. Před 20 lety jsem studoval bifle jako Dokumentační projekt, pak to nahradily věci jako SO. Akorát tedy nevím, z čeho se to AI bude učit, když lidi přestanou vytvářet obsah, protože aby se to učilo nějak samo, k tomu to má ještě hodně daleko.

in reply to Jiří Eischmann

Honza Javorek

in reply to Jiří Eischmann 8 months ago

Tak oni si lidi tyhle věci píšou, jenom je to jinde (různá řešení jsou např. v GitHub Issues), nebo to není veřejně (Discord). Pokud někdo bude potřebovat novější data a SO umře, tak holt nakoupí data z top programátorských Discordů a jede se dál. Ve výsledku mi pak výsledné LLM poradí rychleji a lépe, než kdybych to na těch Discordech hledal sám.

This entry was edited (8 months ago)

in reply to Honza Javorek

Tomáš Znamenáček

in reply to Honza Javorek 8 months ago

@sesivany To je odvážná hypotéza :) V těch issues a Discordech je IMO velká hromada bordelu a na rozdíl od Stack Overflow u nich absentují jasně čitelné signály o kvalitě odpovědí. Jsem hodně zvědav, jestli tyhle „špinavé“ zdroje budou stačit. Stack Overflow ostatně kdysi uspělo právě díky tomu, že člověk věděl, že se nebude muset prodírat hromadou bordelu a rychle dojde ke správné (-ish) odpovědi.

@Jiří Eischmann

This entry was edited (8 months ago)

in reply to Tomáš Znamenáček

Honza Javorek

in reply to Tomáš Znamenáček 8 months ago

@zoul @sesivany Můžeš použít existující LLM na to, aby pochopil ty konverzace a ten bordel trochu vyčistil. Chvíli se budeme nacházet ve zvláštním mezistavu, ale podle mě se tyhle věci pak zajedou a budeme schopni jednak dostávat data z míst, odkud to předtím vůbec nešlo, jednak je čistit způsoby, kterými to předtím nikdy nešlo.

Laškuju s myšlenkou, že LLM jsou asi něčím, co lidstvo už dlouho potřebovalo, aby se vyznalo v kvantech bordela. Dřív to byl search typu Google, ale to dnes už nestačí.

@Tomáš Znamenáček @Jiří Eischmann

in reply to Honza Javorek

Jiří Eischmann

in reply to Honza Javorek 8 months ago

@zoul mě na tom mrzí jen to, že to povede k uzavírání znalostí. LLM naučené jen na otevřených zdrojích budou vždycky horší než LLM, které se naučí na těch otevřených a ještě na uzavřených. Správci těch zdrojů budou motivovaní to uzavírat, protože to budou moct lépe zpeněžit. Že se podpora různých projektů přesouvá na Discord popravdě považuji za velmi špatný trend.
Tady doufám v nějaké soudní rozhodnutí, že trénování LLM není fair use a vznikne nějaká viralita u toho obsahu. Ale to AI lobby je tam obrovské, že jsem k tomu skeptický.

@Tomáš Znamenáček

in reply to Jiří Eischmann

Honza Javorek

in reply to Jiří Eischmann 8 months ago

@sesivany @zoul Že se podpora různých projektů přesouvá na Discord taky považuji za velmi špatný trend, ale open source alternativa, kterou by šlo používat stejným způsobem, neexistuje.

@Tomáš Znamenáček @Jiří Eischmann

⇧

Honza Javorek 8 months ago • •

Honza Javorek
8 months ago