StackOverflow je prý mrtvé. No je pravda, že v poslední době, když tam jdu něco hledat, tak jsou tam otázky i odpovědi zpravidla 3, 5, nebo dokonce 10 let staré, ale aktuálnějšího často nic nenajdu 🫤 blog.pragmaticengineer.com/sta… #links
in reply to Jiří Eischmann

Tak oni si lidi tyhle věci píšou, jenom je to jinde (různá řešení jsou např. v GitHub Issues), nebo to není veřejně (Discord). Pokud někdo bude potřebovat novější data a SO umře, tak holt nakoupí data z top programátorských Discordů a jede se dál. Ve výsledku mi pak výsledné LLM poradí rychleji a lépe, než kdybych to na těch Discordech hledal sám.
This entry was edited (3 months ago)
in reply to Honza Javorek

@sesivany To je odvážná hypotéza :) V těch issues a Discordech je IMO velká hromada bordelu a na rozdíl od Stack Overflow u nich absentují jasně čitelné signály o kvalitě odpovědí. Jsem hodně zvědav, jestli tyhle „špinavé“ zdroje budou stačit. Stack Overflow ostatně kdysi uspělo právě díky tomu, že člověk věděl, že se nebude muset prodírat hromadou bordelu a rychle dojde ke správné (-ish) odpovědi.
This entry was edited (3 months ago)
in reply to Tomáš Znamenáček

@zoul @sesivany Můžeš použít existující LLM na to, aby pochopil ty konverzace a ten bordel trochu vyčistil. Chvíli se budeme nacházet ve zvláštním mezistavu, ale podle mě se tyhle věci pak zajedou a budeme schopni jednak dostávat data z míst, odkud to předtím vůbec nešlo, jednak je čistit způsoby, kterými to předtím nikdy nešlo.

Laškuju s myšlenkou, že LLM jsou asi něčím, co lidstvo už dlouho potřebovalo, aby se vyznalo v kvantech bordela. Dřív to byl search typu Google, ale to dnes už nestačí.

in reply to Honza Javorek

@zoul mě na tom mrzí jen to, že to povede k uzavírání znalostí. LLM naučené jen na otevřených zdrojích budou vždycky horší než LLM, které se naučí na těch otevřených a ještě na uzavřených. Správci těch zdrojů budou motivovaní to uzavírat, protože to budou moct lépe zpeněžit. Že se podpora různých projektů přesouvá na Discord popravdě považuji za velmi špatný trend.
Tady doufám v nějaké soudní rozhodnutí, že trénování LLM není fair use a vznikne nějaká viralita u toho obsahu. Ale to AI lobby je tam obrovské, že jsem k tomu skeptický.