Menu
O mnie Kontakt

DevMentors omawia nowy trend w programowaniu, który może zrewolucjonizować sposób, w jaki pracujemy jako programiści. Wideo dotyczące narzędzia Devin AI wywołało lawinę komentarzy w internecie. Ta sztuczna inteligencja obiecuje, że stanie się naszym nowym kolegą z pracy, pełniąc rolę inżyniera oprogramowania. Oglądając możliwości DeVina, autorzy programu są pod wrażeniem, ponieważ wykazuje on umiejętności brać na siebie odpowiedzialność, przeglądać dokumentację oraz wykonywać testy, co zbliża go do ludzkiego sposobu myślenia. Devin AI jest zaprezentowany w formie split-screen, gdzie można obserwować, jak narzędzie przegląda dokumentację, uruchamia testy jednostkowe, a także przypadkowo wprowadza 'debuggi', co dodaje autentyczności prezentacji.

Z drugiej strony, pojawiają się pytania o rzeczywistą wartość DeVina w codziennej pracy programisty. Użytkownicy rozważają, na ile narzędzie jest praktyczne i czy w ogóle potrzebują tak złożonego rozwiązania. Pojawia się obawa, że Devin, mimo że reklamowany jako sztuczny inżynier oprogramowania, może wprowadzać chaos, nie oferując jednocześnie praktycznych wyników. Jak zauważają autorzy, również istnieje obawa, czy sztuczna inteligencja, która bazuje na dostępnych w internecie informacjach, jest w stanie sprostać oczekiwaniom programisty.

Warto zwrócić uwagę na prezentację i jakość materiału promocyjnego. Wygląda na to, że wideo, które miało zaprezentować potencjał DeVina, nie spełnia oczekiwań. Większość filmów pokazujących możliwości sztucznej inteligencji odbywa się po fakcie, co może budzić wątpliwości co do skuteczności narzędzia. Zwracają uwagę na problem, że jeśli używamy narzędzia, które nie potrafi samodzielnie generować wyników w czasie rzeczywistym, to jego użyteczność staje pod znakiem zapytania.

Kolejnym ciekawym pytaniem jest, czy Devin rzeczywiście jest narzędziem, które zrewolucjonizuje programowanie i czy jest w stanie pracować samodzielnie w złożonym środowisku zespołowym. Autorzy materiału zauważają, że sam proces tworzenia aplikacji w obliczu dynamicznej zmiany wymaga ciągłej interakcji i współpracy z innymi członkami zespołu. Devin może pomóc w wykonywaniu pewnych zadań, jednak nie zastąpi ludzkiego zrozumienia kontekstu realizowanych projektów. Dodatkowo, istnieje wiele aspektów softwarowego inżynierstwa, które są nieuchwytne dla AI.

Podsumowując, DevMentors podkreślają, że chociaż Devin AI może wydawać się fascynującym narzędziem do pracy, to nie ma powodu do paniki wśród programistów. Statystyki na chwilę pisania tego artykułu wskazują, że liczba wyświetleń filmu zatrzymała się na 16,845, a liczba lajków wynosi 425, co sugeruje, że zainteresowanie tematem może się rozwijać. Zobaczymy, co Devin będzie mógł zrealizować w przyszłości, ale na razie programiści mogą poczuwać się względnie bezpiecznie w swojej roli.

Toggle timeline summary

  • 00:00 Dyskusja na temat pojawienia się rozwiązań AI, które mogą potencjalnie zastąpić programistów.
  • 00:15 Ostatnie reakcje w Internecie na nowego inżyniera AI znanego jako Devin AI.
  • 00:33 Imponujące funkcje zaprezentowane w krótkim filmie demonstracyjnym Devin AI.
  • 00:51 Możliwości Devina obejmują wielozadaniowość w różnych zadaniach programistycznych.
  • 01:43 Zadziwiająca podobieństwo procesu myślenia kodującego Devina do ludzkiego.
  • 02:05 Wgląd w to, jak Devin używa technik debugowania podobnych do ludzkich programistów.
  • 02:23 Dyskusja na temat istotności wyświetlania wielu zadań programistycznych na ekranie.
  • 02:51 Wątpliwości dotyczące niezawodności Devina i roli nadzoru ludzkiego.
  • 04:00 Dyskusja na temat dostępności Devina dla użytkowników nietechnicznych.
  • 04:30 Debata na temat praktycznych implikacji korzystania z AI w zadaniach programistycznych.
  • 05:24 Badanie relacji między narzędziami AI a ludzkimi programistami w rozwoju oprogramowania.
  • 06:05 Analiza różnych filmów promocyjnych wydanych przez Cognition Labs dotyczących Devina.
  • 07:08 Krytyka jakości produkcji i skuteczności filmów promocyjnych.
  • 08:12 Ocena wykonalności i funkcjonalności Devin AI w zastosowaniach w rzeczywistym świecie.
  • 09:38 Dyskusja na temat potencjalnych ryzyk i kwestii etycznych związanych z użyciem AI w programowaniu.
  • 10:00 Refleksje na temat ewolucji narzędzi AI w branży technologicznej.
  • 10:26 Zmiany w nastrojach publicznych dotyczących technologii AI w miejscu pracy.
  • 11:22 Porównanie zastąpienia miejsc pracy przez AI z historycznymi trendami zatrudnienia.
  • 11:57 Wnioski na temat przyszłej roli AI w inżynierii oprogramowania i jej wpływu na miejsca pracy.
  • 12:33 Apel do oceny praktyczności i zrównoważoności rozwiązań AI w biznesie.
  • 18:07 Ostateczne przemyślenia na temat integracji technologii AI w różnych sektorach.

Transcription

Czy to jest ten dzień, ten dzień, w którym pojawi się rozwiązanie, które zastąpi nas, programistów? Odbierze nam 15K, przynajmniej. Słuchajcie... Słuchajcie, wczoraj i przedwczoraj cały internet zalała fala komentarzy na temat nowego rozwiązania, pokazanego w ramach takiego 1,5-minutowego czy 2-minutowego filmu rozwiązania, które notabene ma być takim AI-owym software-engineerem. Tak, o nazwie Devin AI. Tak, film, który, no muszę przyznać, zrobił tak wrażenie w rozumieniu, kiedy oglądam możliwości tego narzędzia, no to faktycznie wyglądało to dosyć imponująco, ponieważ w odróżnieniu od, powiedzmy, takiego typowego promptu, przykładowo, nie wiem, z czatu GPT, gdzie po prostu piszemy pytanie i dostajemy odpowiedź w formie tekstowej, tam w ogóle pojawił się wyższy poziom, pojawiły się kolejne wymiary, ponieważ Devin jako software-engineer, tak jak Wy, pracuje na wielu oknach, tak więc on jako, mimo tego, że jest sztuczną inteligencją, robi sobie splita na ekranie i potrafi, no właśnie, poprosząc go na przykład o napisanie jakiejś aplikacji, z jednej strony będzie miał okno, które będzie np. czytało dokumentację albo przeglądało GitHuba i Kodzik, z drugiej strony ma prompta, w którym odpala unit testy, a w trzecim ma jeszcze coś innego, w którym, nie wiem, dokonuje, nie wiem, jakiejś tam wizualizacji albo odpalenia lokalnego Waszej aplikacji, oczywiście jest w stanie zrobić wszystko, od konteneryzacji, od wrzucenia tego gdzieś tam później na stronę. No to pokazuje plan, to było w sumie chyba jedna z takich ciekawszych rzeczy, bo sam fakt, że AI jest w stanie, tak, wygenerować jakiś snippet kodu, czy nawet całe rozwiązanie, to już widzieliśmy do tej pory. Ciekawe było to, że ten proces myślowy, który tam był pokazany, był faktycznie bliski takiemu ludzkiemu, co mnie zaskoczyło. Nie wiem, czy to było intencjonalnie, ale ten AI również stosuje tak zwany dupa debugging, to znaczy wkleja printy w różnych miejscach w kodzie i patrzy, co się dzieje. Do dupa debugginga sobie zaraz też przejdziemy, ale może najpierw takie pytanie do Ciebie, Michał. No bo trzeba przyznać, że w jakimś stopniu robi to wrażenie. No myślę, że ten 1% niepewności jest taki, a może to już pomału przechodzimy na ten tryb faktycznie AI-owy, w którym my jako programiści nie będziemy już potrzebni, ale moje pierwsze pytanie to było jakby po co jest ten cały split, jakby bo rozumiem, że to ma być taki software engineer AI-owy, ale po co ja to mam oglądać? No bo z drugiej strony, jeżeli nie wiem, daje jakiś złożony problem i nawet przegląda nie wiem tam stacka, czy przegląda cokolwiek innego, to jaka to jest wartość dodana dla mnie? Widzę, że on skorzystał ze stacka Overflow, i tak musicie to przeczytać, żeby zanalizować, czy w ogóle kod oparty o jakiś fragment kodu albo dyskusję tam zawartą jest w ogóle poprawny. To jest w ogóle bardzo ciekawe pytanie, bo nie wiem, czy to jest forma jakby takiej superwizji programisty, czy ten algorytm nie leci sobie w kulki, czy ja rozumiem w ogóle, co on robi, to jest pierwsza rzecz, ale ja właściwie zacząłem się zastanawiać, no bo to jest reklamowane jako software engineer taki AI-owy, który właściwie zrobi wszystko od A do Z, to ja się zastanawiam, czy on musi w ogóle jakiegoś języka programowania używać, albo czy nie jest w stanie jakimś klockami low-codowymi tego zbudować, ale faktycznie to było trochę dziwne, bo zaraz pewnie do tego przejdziemy, ale ja mam wrażenie, jakby ten split screen i wizualizacja tego postępu pracy to jest bardziej taki marketing pitch, niż właściwie, no bo w sumie nawet tak na to patrzyłem, jak sobie odtworzycie teraz, czy po tym materiale ten film, to zobaczycie, że to jest nawet upierdliwe, bo z jednej strony mam okno, nie wiem, tam maszyny wirtualnej, czy tam jakiegoś kontenera chyba Ubuntu, w lewym dolnym rogu widzę, jakie on strony przegląda, po jaku cholerę ja mam widzieć w ogóle, co ten AI przegląda, w sensie… A no i dochodzi jeszcze pytanie, dla kogo jest w ogóle sam Devin, no bo z jednej strony dla osób, które są nietechniczne, no to wysrywanie, nie wiem, tych wszystkich dokumentacji, testów, czy czegokolwiek innego, albo szczególnie konsoli z jakimiś tam błędami, no jest nieefektywne, to znaczy i tak nie posiadając więcej inżynieryjnych, nie jestem w stanie powiedzieć, czy to, co tutaj zostało użyte jest poprawne, to jest raz. Nawet bardziej jest przytłacające, jakbyś porównał czat GPT z tym narzędziem, to jest bardziej przytłaczające, więcej się dzieje, nie wiesz w ogóle, o co chodzi i tak dalej. Oczywiście znów, no jakby zakładając, że robimy, nie wiem, że jesteśmy proszeni o zrobienie jakiejś, nie wiem, aplikacji bardziej biznesowej, no to z punktu widzenia mnie jako osoby zadającej ci zadanie liczy się rezultat, w sensie ta cała masa tego ścieku jakości kodu paradoksalnie jest tak naprawdę drugoplanowa, więc to jest takie dla mnie trochę śliskie. Druga rzecz, okej, jeżeli jest dla programista, to teraz co, ja normalnie, nie wiem, jestem w stanie polegać na swojej wiedzy, którą gdzieś tam zdobywałem latami i jestem w stanie mniej lub bardziej skakać po kodzie, który znam, do tego, żeby ewentualnie jakieś tam bugi niwelować, a teraz mając takiego dewina, on mi, nie wiem, poproszę go o zrobienie jakiejś tam stronki, ona nie działa zgodnie z moimi oczekiwaniami, co pewnie jest też po pierwsze kwestią tego, jak chociażby zostało mu zadanie przedstawione, kontekst pracy i tak dalej. No i teraz widzę, że mam jakiś bug, który ewidentnie sprawia, że aplikacja nie działa zgodnie z moimi takimi funkcjonalnymi oczekiwaniami i teraz co, będę skakał po tym promptzie, jeżeli ta aplikacja jest większa, która będzie miała, nie wiem, wiele, może setek, tysięcy jakichś konkretnych iteracji w ramach procesu wytwarzania tego kodziku? W ogóle mam wrażenie, że tutaj jak my czasami sobie opowiadamy też o tym, jak programiści powinni uczestniczyć też w procesie zbierania wiedzy, w ogóle rozmawiania z biznesem, to mam wrażenie, że ten łańcuch jak się zaczyna wyciągać, bo będzie biznes, potem będzie analityk, potem będzie deweloper, potem będzie może jeszcze jakiś prompt deweloper, nie daj Boże i na końcu będzie AI i będzie takie, no co to robi, nie wiem, muszę spytać tamtego Ziutka. Dobra, to teraz Ziutek pójdzie, spyta Kasia, co tam AI wygenerowało, on tam usiądzie, przejrze tu sesję faktycznie, jak w tym Devinie widać, co on tam robi, może sobie kliknąć play, pokaż, co tam się działo, on będzie teraz siedział, analizował, co autor miał na myśli i koniec końców może się domyśli, może nie, może to poprawi, nie wiem, to jest w sumie jedna rzecz. Ale Michał, ok, załóżmy, że to nie jest skam, załóżmy, że to jest legit, na samej stronie Cognition, czyli firmy, która, Cognition Labs, czy Cognition, czyli tej firmy, która de facto jest odpowiedzialna za stworzenie tego niesamowitego dzieła, pojawiły się inne filmy na YouTube, czyli 12 marca zostały one opublikowane, jest ich chyba około dodatkowo siedmiu i trwają dosłownie po półtorej minuty i są to różni, zakładam, pracownicy Cognition, którzy pokazują w różnych przypadkach użycia, jak Devin po prostu ratuje ich z opresji, więc mam spisany pierwszy film na Cognition, więc jest to pani, która generuje sobie tapetę, ma jakąś tam tapetę, która została wygenerowana przez Devina w oparciu o jakiś tam zadany zestaw danych wejściowych. Tak, tam chyba chodziło o to, żeby wygenerować jakąś tapetę, w której jest ukryty jakiś tekst, tak w ramach po prostu krajobrazu, kompozycji i tak dalej. Tak, i de facto, szczerze, ten film jest nieporywający, ale jedna rzecz, która przykłała moją uwagę, to jest to, że pani pokazywała, jak Devin podszedł do rozwiązania tego problemu, ale nie w sposób takiego live-dema, to znaczy już był wygenerowany prompt, po którym ona jedynie, tak jak powiedziałeś, przechodziła po prostu strzałką w prawo i nie widać było de facto tej magii, tego procesu, że ona pisze tekst, następnie klika Enter i tam się wszystko dzieje, nagle wyskakuje mi tapeta. Ona już wszystko miała przygotowane i sobie tylko skakała po krokach. Okej, może przypadek, ale idziemy dalej, mamy film numer dwa i teraz o co chodzi. Gość znów poprosił Devina o to, żeby zrobić gierkę, taka trochę pikseloza, no i tam chce dodawać jakiejś funkcjonalności. No to chyba gra w życie w ogóle była z tego, to chyba tak, to było Game of Life, czyli taki automat skończony, czy jak to tam się nazywa, nie pamiętam, przepraszam. Tak i teraz, i teraz, i teraz do czego zmierzam. No pierwsza rzecz, robimy poważną firmę, tak, jesteśmy poważni na rynku. Gość nagrywa z takim po prostu Michałkiem po lewej strony, gdzie widać, że ma nagrywanie ekranu, które tam trwa od 30 sekund. Film jest nagrywany chyba dwunastego, czyli w ogóle w dzień relisa, oni to wydają. Jakość mikrofonu jest taka dwa na dziesięć i szczerze mówiąc, no mniej jako gościa, który tak patrzy na to z zaciekawieniem, jest to taka lampka ostrzegawcza, że coś takiego. Jest ogólnie wątek na reddicie, to jest chyba na CS Career Questions, albo coś w tym stylu, czyli osoby, które wchodzą do branży i zadają pytania. I tam jest jeden gość, który zrobił sobie takie CSI Reddit, na którym przeanalizował trochę też więcej takich śmierdzących tematów, na przykład zobaczył sobie, że ta aplikacja to jest ta, którą tam sobie widzimy, którą oni odpalają. Do tego sobie zaraz przejdziemy, spokojnie, bo to jakby kabarecik się dopiero rozkręca widzowie. Ok, chciałem jeszcze pozostałe filmy omówić. Tak, tak, tak, żebyśmy mniej więcej rozumieli, czyli na razie to, co jeszcze jest istotne w filmie numer dwa, tam też również przechodzimy po tym Devinie w sposób taki iteracyjny, ale już post-factum, czyli nie widzimy tej magii, więc no i do tego ta kamerka z ziemniaka. Czyli właściwie to samo co w pierwszym, tylko w tym drugim, z tego co pamiętam, on chyba pokazał też, że zdeployował to na Netlify. Tak, na Netlify i faktycznie to kliknął, wszystko działało i super. Great success. Nie wiemy tego w sumie. Nie, no zakładamy, że zadziałało, tak. Ok, no zakładamy. Ale trzeci filmik jest mocny, trzeci filmik to jest chyba mój faworyt, trzeci filmik tam już ewidentnie widać, że gość jest taki poważniejszy, więc zakładam, że jest seniorem, taki już trochę zmęczony życiem i gość robi PR-a, gość poprosił Devina po to, żeby faktycznie zrobić jakiś tam kodzik i on wrzuca do Mproxa jakiś tam kodzik, który jest poprawiony. On go chyba poprawiał, dopisał jakiś tam fragment kodziku, wrzucił w ogóle pull requesta i uwaga, ten pull request, który on pokazuje faktycznie znajduje się na GitHubie, więc jest to pull request numer 118. Problem jest taki, że niestety nie spotkał się on z za dużo aprobatów, to znaczy tam był chyba z tego co pamiętam jeden taki komentarz, który był taki wow, dziękujemy ci mój oświecony przyjacielu, który zostałeś stworzony z rękami ludzkimi, a teraz robisz takie wspaniałe rzeczy, zakładam, że trochę rofl. A drugi ziomek napisał, że kolejny ścieg wyprodukowany przez EA i za dużo komentarzy i tego dupa debuggingu, o którym mówiłeś. Więc no nie pykło, natomiast co było ciekawe i znów wspólny mianownik, znowu nie było live demo, tylko przejście po po prostu już wygenerowanym wcześniej prompcie. Ten czwarty filmik jest ciekawszy, bo to wrzuciłeś nam filmik numer 4 związany z Computer Vision i z tego co pamiętam to był filmik, który miał wykrywać na zdjęciach dziury w jezdni, czy uszkodzenia ogólnie jezdni i to było chyba zadanie w ogóle z Upworka? Tak, to było zadanie z Upworka i to jest ciekawe, bo wydaje mi się, że takie narzędzie w takiej formie ma bardziej szansę zaatakować takie tematy typowo freelancerskie i przyznam szczerze, że samo rozwiązanie wydało mi się dość imponujące, bo faktycznie ten problem do rozwiązania był dość ciężki. Ten prompt też był słaby ogólnie z punktu widzenia tego, co użytkownik przesłał. Powiedział, że tu jest jakieś zadanie, tu jest jakieś repo, wiesz co jakby rozkmin to, bo nie wiem właściwie jak do tego podejść. No i wynik wydaje się faktycznie fajny, wydaje się, że to działa. Tak, na końcu w ogóle prompt, nawet faktycznie jak zrobiłem sobie stop klatki to tam było nawet pytanie, że okej, a gdzie jest rezultat? Oczywiście rezultat jest tutaj, wszystkie zdjęcia z... Dokumentacja chyba w ogóle była na końcu jak podszedł do tematu, jakie były wyniki. Był taki plik txt jakby z jego metodologii o pracy. Tak, takie podsumowanie. Znowuż, kurczę, nie wiem no jakby... Znowu było to, trzeba powiedzieć, nie live. To znaczy nie widziałem jak to się zadziało, tylko przeszedłem sobie po jakimś tam... No to dla mnie póki co to wygląda jak takie slajdy przygotowane. Mam slajdy, po których sobie klikam i o zobaczcie w kolejnym slajdzie jak teraz sobie przejdę to z mojego prompta wygnoruje mi się wiesz gierka. Wygląda dziwnie. I ostatni film, który mamy to jest drugi atempt DeVina jeśli chodzi o pull requesty. Wreszcie mu nie poszło jakoś tam najlepiej. Z tego co pamiętam chodziło o to, że gość poprosił o napisanie testów regresji i dzięki temu wykrył, że jakiś tam jeden z parametrów ma wartość ujemną, co nie powinno mieć miejsca, więc DeVin dorzucił dodatkowo jeszcze jeden jakiś tam warunek, który sprawiał, że faktycznie te testy zaczęły mu przechodzić. No i cóż, zobacz, znów ten pull request istnieje, ale co ciekawe tutaj doszło do śmiesznej sytuacji, bo jak zazwyczaj zobaczyłem to w ramach tego pull requesta DeVin, który posiada oficjalne konto na GitHubie, natomiast jest mało aktywny. W stu komitach by już odpadł raczej, chyba ze cztery jakieś tam activities. Natomiast DeVin zrobił cztery pull requesty, cztery komity w ramach tego samego pull requesta i każdy z nich jest taki bardzo powiedziałbym trochę ludzki. To znaczy typu mała poprawka tutaj, tutaj zamieniłem jakiś warunek na powiedzmy jakieś skrócone wyrażenie, takie trochę szwindel i znów oczywiście nie live. Więc ogólnie ten YouTube szczerze mówiąc to tak podważył trochę, podkopał moje zaufanie co do samego Cognition i do samego narzędzia, no bo jeżeli ja cały czas widzę slajdy. Pierwszy materiał faktycznie był taki, że wow, to zazwyczaj tak jest, że jak widzisz jakiś taki pitch trochę w którym pokazujesz co jakieś rozwiązanie może masz takie o ok i im dalej zaczyna się to zagłębiać to jest takie. Tak, ale z drugiej strony już do tego zaraz myślę przejdziemy, ale wiesz Michał teraz tak, każdy jest teraz leci na hype trainie AI i każde filmy są wow. Myślę, że Google też miał prezentację wow, gdzie pokazywali obiekty, potem się okazało, że jak były live demo to już to się nie zgadzało dokładnie ze stanem. To chyba nie działało w ogóle. Więc ja już tak na to, oczywiście robi to wow w takim rozumieniu, że faktycznie gdyby to działało to byłoby super, ale gdzieś tam z tyłu głowy już czułem, że jest szwindel, ale dobra słuchajcie załóżmy, że to jest legit i faktycznie filmy są oparte o narzędzie, które działa. Przejdźmy sobie do Cognition Labs, bo to jest właśnie trochę ten content podpierdolony od tego gościa z reddita po części, bo on tam faktycznie opisał sobie kilka takich ciekawych uwag. Pierwsza rzecz jest taka, to był zajebisty komentarz, który wrzucił, że strona Cognition Labs wygląda w ten sposób. Ona wygląda jakbyśmy my ją napisali, umówmy się. Ona wygląda jak... Przepraszam cię bardzo, ja uważam, że mam lepsze skille frontendowe. Dobra, tak jak ja bym napisał, to jest taki mój poziom robienia frontendu jako backend. Tam był jeden słuszny argument, to znaczy skoro ten AI jest tak dobry, to dlaczego Cognition nie zrobił lepszej strony? To czemu takie gówno sobie wypluł? Ale to jest dopiero początek, bo Hit to jest... Zauważmy jedną rzecz, fajny tool, ale chciałbyś się nim pobawić, tak? Więc załóżmy, że chciałbyś dopisać się do waiting listy i zobacz, że jeżeli chciałbyś faktycznie zatrudnić Dewina do swoich prac inżynieryjnych, to dołącz do naszej waiting listy i jest to... Czekaj, co to jest? Google Forms, proszę bardzo, możesz podać swój LinkedIn profile i tak dalej. To jest właśnie mądre wykorzystanie, nie wynajdujemy koła na nowo, Michale, tylko są Google Formsy, to używamy Google Formsu, więc wszystko jest dla mnie legit. Ale poczekaj, skoro to jest taki zajebisty AI inżynier, to czemu nie mógł formularza sam napisać? Nie rozumiem. Do tego przejdziemy też, Michał. Koszty, to nie jest tak, że to jest za darmo. Tutaj krzem przepalasz, a tutaj już Google, przepalasz na krzemie Google'a. Wszystko dla mnie jest legit. Rozumiem, bo to ma ilość kosztowa. No nie jest, powiedziałbym, jakaś super. Blog to faktycznie jest ten film plus jakiś tam tekst i te wszystkie filmy, które żeśmy wam streszcili, polecam się zapoznać, jest to wybitne dzieło. Na końcu z informacją, która też pojawiła się w tym filmie promocyjnym, czyli jeżeli chodzi o to ratio rozwiązywania issuesów, które w przypadku DeWina jest bliskie 14%. Tak, to chyba jest benchmark, tak? To jest ogólny benchmark, który weryfikuje, czy te modele LLM-owe są w stanie właściwie pracować trochę jak software engineer. Tu w tym przypadku po prostu jest próbka jakichś tam issuesów, które może próbować sobie ten AI rozwiązywać. No i faktycznie 14% względem jakby konkurencji to się wydaje całkiem spoko, zwłaszcza, że ta firma istnieje 4 miesiące. Z tego co pamiętam, oni 4 miesiące temu wystartowali. I już napisali DeWina, nie? Ciekawe co będzie za kolejne 4 miesiące. No ja się już boję, bo skoro OpenAI, na które włożono tam miliardy dolarów ma 1,74 z modelem GPT-4. Tam chyba ten Cloud II był chyba najlepszym, chyba jest nawet wersja trzecia już teraz, tam też były komentarze, że nie przyrównują tego do najnowszej wersji. Słupki jak z TVP, są proporcjonalne, ale widać, że jest grubo. Tu jeszcze jest gwiazdka na dole, to już taka typowa podkręcona, nie wiem czy ją czytałeś. Test został wykonany na losowo wybranej próbce 25% przykładów z całego benchmarku. Ciekawe jak to losowo. No pewnie dobiera, dobra nie będę nic sugerował, bo zaraz zamienię się w Mazurka z kanału Zero, który się do wszystkiego czepia. Zakładamy, że losowo 25% wybranego zbioru, zakładam, że też był jakiś zbiór treningowy i zbiór do faktycznej weryfikacji, tak jak kojarzycie pewnie z uczenia maszynowego, zazwyczaj tak to wygląda. Tak, ja jeszcze chciałem powiedzieć jedną rzecz, bo zauważmy, że ta strona, czyli preview.devin.ai, na której był pokazywany ten inicjalny filmik, ona istnieje, możecie sobie na nią wejść. Ona wygląda już trochę inaczej, ona wygląda trochę bardziej dla mnie jak chat GPT, już ma tylko takiego typowego prompta, ale zobacz Michale, że możesz zobaczyć jakie masz analizy. Run my github repo, mogę sobie na przykład kliknąć, od razu mi się dzięki temu guzikowi podmienia tekst. Nie wiem, czy to jest zrobione przez AI, być może. I w momencie, w którym klikam enter. Niestety, ale muszę znowu mieć mój request access. O, czyli Devin, zobacz, napisał jednak alternatywę, chyba, że to pod spodem strzela do nasza kuku. To jest ciekawe, bo tam tak generalnie, tam też ziomek z reddita całą infrę pokazywał, która jest użyta do autoryzacji, która jest właśnie użyta do, nie pamiętam, chyba Cloudflare'u, czy jakichś tam innych. Tak, tam jest hotjar użyty też pod spodem do analizy, nie sentymentu, tylko ogólnie ruchu na stronie. Nie wiem, jaki to ma być ruch, bo wszystko jest wyłączone. Tak, ale generalnie TLDR jest takie, że potrzebujemy dostać dostęp do tego, aby korzystać z Devina i dopiero wtedy będziemy mogli tutaj coś klikać. Oczywiście można domniemywać, że ten dostęp nie będzie przydzielany od razu i nie wszystkim, a może i nikomu. Na pewno, na pewno, pewnie, jasne, zobaczymy, czas pokaże, czas pokaże. I jeszcze kolejna rzecz, a propos amatorki takiej, przypomniała mi się trochę case z Multikinem, bo Multikino, nie wiem czy wiecie, przez długi czas miało niezminifikowane JS, co rodziło pewną podatność, jeżeli chodzi o kupowanie biletów. I podobnie tutaj, ziomek z reddita ogarnął, że tam są komponenty reaktowe, które są niezminifikowane. Już próbowałem wczoraj, już zmienili na aplikację, tak, ale generalnie ReleaseView. Czyli są dynamiczną firmą, czytają reddita, adaptują się. Nie no, tam ogólnie jak wejdziecie sobie na tą stronkę, to tam w lewym dolnym rogu tego prompta jest spinacz, w którym można było wrzucać pliki i się okazało, że ogólnie było zablokowane wysyłanie promptów, ale pliki można było wysyłać ile się chciało. I na początku chyba uznali, że będą w stanie po prostu, jakby ten gościu wrzucał, oni usuwali ręcznie, on wrzucał, oni usuwali. Znaczyli im się juniorzy pod spodem i trzeba było już po prostu. Znaczy, zakładam, że w końcu uznali, że może warto byłoby dodać autoryzację do Gangpointa i faktycznie teraz już trzeba być zarejestrowanym i mieć dostęp. Czy Devin tego nie wykrył? W ogóle to jest ciekawe, czy Devin napisał sam tą stronę, nie? Czy Devin byłby w stanie napisać sam siebie? Piszcie w komentarzach, co sądzicie, czy Devin jest w stanie tak stworzyć… To jest ciekawe, bo on teraz powinien sam siebie improwować, no bo to jest trochę jak kojarzycie, pewnie część przynajmniej kojarzy, że maturity np. danego języka określa się tym, czy da się np. dany kompilator napisać w tym samym języku. Rozlin jest przykładem. Przykład C-Sharpa, tak? Rozlin kompiluje sam C-Sharpa i jest napisany w C-Sharpie, więc to jest jedna z takich… więc w teorii ciekawy ten. Ale dobra, słuchaj, wracając trochę do tematu, bo… no dobra, strona kogniczna nie jest taka mech, ale umówmy się, że oni stawiają na minimalizm. W ogóle też to, co ciekawe, to to, że ten CEO, co-founder i w ogóle tam jeszcze pewnie z pięć tytułów na LinkedInie, czyli z… jak się nazywa? Scott Wu? No na LinkedInie jest chyba też taki w miarę zielonko i z tego, co widziałem za dużo postów nie ma, ale też chciałem zwrócić jedną uwagę, bo X ogólnie jest znany… znaczy inaczej, teraz jest postrzegany jako taka platforma, która wiedzie prym w toksikach, nie? A wcześniej nie był, przepraszam bardzo. Nie, no ale chodzi mi trochę bardziej też po ogólnie przejęciu przez maskę, no to tam już w ogóle widać był taki pewien improvement. Znaczy spuścił rozumiem jakby… Tak, tak. Politykę jakby wolności słaba i tak dalej, ale zauważcie, że pod filmikiem jakoś same też tylko pozytywne komentarze. This looks truly incredible. Jakieś tam inne rzeczy. Powiem szczerze, ja przeglądałem te profily, ogólnie zacząłem przeglądać trochę profili związanych z komentarzami pod postami Cognition Labs i w większości to są tacy AI tech bros. Oczywiście jest też trochę ludzi, którzy coś tam robią jeśli chodzi o software engineering, ale to się wszystko kręci wokół tej takiej bańki AI-owej. No i część takich kont, które są dziwne, podejrzane, bo mają około tysiąc followersów i tak nie za dużo activity, więc to też jest… W ogóle jak teraz scrollowałeś to zauważyłem, że wszystkie profile są zweryfikowane, to też jest w sumie dziwne, w sensie jakby… Więc pytanie czy mają bardzo dobrą moderację, w której wywalają negatywne komentarze, co… Może Devin też… A może Devin nadzoruje, nie wiadomo. W ogóle to jest też ciekawe, że Scott Wu jest… Na jego Linkedinie znalazłem informację, że on był też co-founderem innego jakiegoś przedsięwzięcia Lunch Club, nie wiem czy słyszałeś o nim. Poza tym, że mają logo podpierdolone z tretsów, tylko że przerobione na takie bardziej L. Mnie bardziej przypomina logo Generic Electrics, nie wiem czy kojarzysz też trochę w takim feelingu. Ale to też jest ciekawe, bo ja przeglądałem też ten profil, jak go mi podrzuciłeś i tutaj mam wrażenie, że w pewnym momencie zrobiono trochę szumu wokół tego rozwiązania. Jest dużo komentarzy typu, wow, poznałem nowych ludzi używając tego narzędzia i potem cisza. Tam chyba przez dwa miesiące w 2022 roku coś tam się działo, a potem jest… Ale w ogóle co to jest za narzędzie, bo aż musiałem przeczytać, bo ja nie za bardzo rozumiałem jakby core. Bo strona jest od razu, wam powiem widzowie, w takim samym stylu, czyli tam jest jeszcze mniej informacji niż na tym pierwszym. Wiem, że to jest możliwe, ale Lunch Club is an AI super connector that makes introduction for one-on-one video meetings. We are backed by lightspeed, bla, bla, bla i to już jakby jest nieistotne. I ja się zastanawiam jakby o co chodzi, ja trochę nie rozumiem z tego… Z tego co zrozumiałem to bardziej chodzi o to, że to jest taka forma speed networkingu, to znaczy masz sieć… Było też takie… Ale to też jak to się nazywało? Omil? Nie, to takie… Omegle? Omegle, tak, tak, że ty klikasz i masz randoma i… Tak, i dostajesz po prostu albo ci usta… Zakładam, że jeżeli to miały być osoby typu, nie wiem, jakieś CEO, CTO, jakiś dyrektor czy coś, to raczej oni nie siedzą na czacie. Ciekawe kto mi się teraz wylosuje, tylko raczej to wyglądało tak, że pewnie jakiś tam meeting ustawiało, ale tak, zakładam, że to było coś w stylu networkingu. Wymieńmy się jakby doświadczeniami z różnych, może z różnych branż, może z różnych stanowisk, jak to wygląda i tak dalej. Ciekawe, czy tam szybko syf się zrobił, bo Omegle ogólnie miał problem z ogórami, nie, ale jestem ciekawy, czy tutaj taki ogórowy CTO na przykład tam wypada. No nie wiem, dobra Michał, co do zasady, jakby ja nie chcę wydawać wyroków, czy Devin istnieje, czy nie istnieje i w jakiej formie, ale powiem Wam szczerze, no nie czuję się jeszcze zagrożony. Natomiast warto byłoby na sam koniec może tak zajawić, nie będziemy myślę robili jakiegoś takiego pełnowymiarowego odcinka, bardziej jest to taki format, w którym po prostu taki ad hocowy na szybko, który chcieliśmy po prostu przekuć swoje jakieś spostrzeżenia. Natomiast pewnie gdzieś kiedyś w przyszłości pojawi się pewnie z kimś bardziej kompetentnym jakaś analiza całego rynku i tego, w którą stronę to zmierza. I co z nami będzie. I co z nami będzie. Ja po Devinie, szczerze mówiąc, po obejrzeniu jego możliwości nie czuję się jeszcze zagrożony, szczególnie po tym kanale na YouTube. Ja się pewnie na razie poczułem, jeśli mam szczerze. Ale o tym tak, jest szansa pogadać, myślę, że w jakimś trochę większym formacie, takim może debacie, może takiej dyskusji właśnie z kimś, kto się zna lepiej niż my. Ale właśnie możemy tak na szybko powiedzieć jak to wygląda z naszej strony. Znaczy o co kaman, jakby po co to wyszło, no bo wydaje się raczej rozsądnym zadanie pytania. Zakładając, przyjmując hipotezę, że Devin nie istnieje, to po co robić taki filmik? Myślę, że jak zaczniemy obserwować, co się zaczęło dziać z, nie wiem, ja sobie staram się w miarę regularnie patrzeć, co się na przykład dzieje na LinkedIn, po tym jak chat GPT wybuchł w zeszłym roku. No i przyznam szczerze, że o ile LinkedIn jeszcze rok temu był platformą, na której ludzie wymieniali sporo swoich doświadczeń takich produktowych, chociażby, czy właśnie w naszej takiej banieczce, powiem, nazwijmy to, software inżynierowej, jakieś takie tipy może od tech-leadów albo od jakichś ciekawostki z różnych odnóg typu cyber security, data engineering, fajnie było tego czytać. Od roku to wygląda tak, że jest od cholery AI prompt engineerów, jest w chuj jakichś kursów pod tytułem, to jest 100 narzędzi AI, których jeszcze nie używasz, żeby być bardziej efektywnym, zarabiać więcej pieniędzy i tworzyć lepsze biznesy i generalnie ta fala, ona się nie kończy. I teraz mi się trochę przypomina, ja też widzę, że wrzuciłeś z obecnie najpopularniejszego kanału na polskim YouTubie wykres, o którym pewnie też sobie jeszcze za chwilę powiemy, domykając. To jest trochę taki moment, w którym jak widzisz, że już taksówkarze zaczynają mówić o AI-u czy o krypto, z którego już tam część ludzi uciekła, no to wiesz, że zaczynamy się zbliżać do pewnej masy krytycznej. Tak, ten jakby wykres, który Wam też wrzucimy z znów wspomnianego wcześniej kanału Zero, to jest z pierwszego odcinka Zaolskiego, w którym on opowiada trochę o tym, w jaki sposób bańki spekulacyjne powstają i on tam właśnie omawiał kwestie AI plus krypto i on przyrównał bańkę, która teraz zaczyna puchnąć, jeżeli chodzi o AI do bańki dotcomowej i on mówił o trochę całym procesie tego, że faktycznie w momencie, w którym zaczęto dostrzegać jakby potencjał i możliwości, które może przynieść nam internet, no to firmy zaczęły masowo chociażby, nie wiem, wykupować sobie jakieś domeny dotcomowe, dał jakiś tam przykład pec.com, których notowania skoczyły tylko dlatego, że posiadali po prostu stronę i byli już scyfryzowani i każdy się po prostu zabierał trochę do, jakby pakował się na ten statek, nie do końca wiedząc po co, dlaczego i gdzie on do końca płynie, ale stateczek już rusza, już jest rozgrzany silnik, więc to jest ostatnia szansa, żeby wskoczyć i wydaje mi się, że oczywiście nie negowałbym kompletnie tego, bo uważam, że AIowe tule i cały czad czy jakiekolwiek inne narzędzia, copilot i tak dalej, chociaż z copilotem też już były sytuacje, w których promptował, co on promptował? Znaczy my też testujemy ogólnie teraz copilota, więc możemy myślę, że tam powiedzieć tak bez wchodzenia w szczegóły, że to jest narzędzie do rozwiązywania żmudnej roboty. No tak, tak, tak, ale ma też takie momenty swoje, w których promptuje tam jakieś because fuck you, that's why, coś takiego promptował? No wziął kod z GitHuba, tak myślę, w kodzie z GitHuba są różne takie środkowe palce od niektórych twórców, jakiś tam pet projectów. Tak i na bazie tego proponuje wam jakiś tam komentarz czy cokolwiek innego, więc tak, są takie sytuacje, natomiast wracając trochę, ja mam wrażenie, że jakby nawiązując do tego, o czym mówił Zaorski, że teraz jest taki moment, w którym firmy zaczynają się pakować i chcą po prostu być w tym trendzie AIowym, ta bańka puchnie i kapitał zaczyna napływać do AIa i oczywiście to się w pewnym momencie skończy, bo ja mam wrażenie, że wiele firm niestety chciałoby mieć AI, ale nie do końca rozumieją po co i gdzie w ich modelu biznesowym ten AI faktycznie może uskuteczniać pracę, bo oczywistym jest to, że w pewnym momencie część roboty zostanie zautomatyzowana. Kiedyś fabryki były w pełni manualne, później faktycznie to, co dało się tam, gdzie dało się człowieka, który jest kapryśny, marudny, czasem zrobi coś gorzej, dało się zastąpić maszyną i to samo będzie z nami. Oczywiście zacznie się pewnie od jakichś prostych prac. Ale z bańką dotkomową to samo było, tak? Na początku było rzucanie się na różne rozwiązania informatyczne, potem faktycznie to się załamało, ale koniec końców, jak sobie tak pomyślimy, to nawet mała firma produkująca szczoteczki do zębów, no to może akurat nie, bo zazwyczaj to robią jakieś tam tuzy wielkie, ale jakaś mała lokalna firma zazwyczaj też ma jakiś mały serwerek, który stoi gdzieś tam u pani Krysi pod stołem, na którym jest jakiś system inwentaryzacji plus zbierania zamówień, chyba, że to mają gdzieś tam zasować. Zazwyczaj jest tak, że to jest gdzieś tam wymieszane część tutaj, część tutaj i myślę, że tutaj będzie bardzo podobnie, tak? To znaczy najpierw to pęknie, a potem oczywiście jakieś mniejsze zadania gdzieś tam w firmach zaczną być zastępowane przez jakieś mniejsze modele sztucznej inteligencji, tak żeby ci ludzie, którzy tam są na miejscu raczej o nie zostaną, tylko po prostu będą się zajmowali rzeczami, które po prostu trzeba zrobić fizycznie w świecie, a nie po prostu siedzieć i dupę godziny robić na przykład w Excelu i tyle. Tak, no i pozostaje jeszcze kwestia wydaje mi się samej efektywności takiej kosztowej, no bo wiesz Michał, patrząc na takiego Devina, który tutaj przepala niesamowite ilości energii po to, żeby zbudować mi jakiś niesamowity kodzik, to pytanie jest proste, no fajnie, tylko ile to kosztuje? Bo wiesz, z AI to jest też tak było, że no fajnie, fajnie, super, tutaj sobie zróbcie preview, nagle zaczynają wchodzić modele subskrypcyjne albo modele, w których faktycznie za na przykład użycie jakiegoś bardziej wyłuczonego LMA płacimy znaczące kwoty, umówmy się, więc pytanie jest takie, zakładając nawet, że Devin by działał, czy to nie będzie jednak taki trochę spor dla bogatych, nie? Myślę, że na pewno, zwłaszcza, że jeżeli chcemy, żeby ten model nadrabiał jakby wiedzę czy rzeczy, bo wiecie jak większość z Was pracuje w typowej biznesówce, więc wiecie, że to, że Wy teraz coś wykonacie w tym prompcie związanego z jakimś zadaniem, związanym z kontekstem biznesowym i wrócicie do tego prompta za tydzień, to się okaże, że ta rzeczywistość, która otacza ten soft, ona się już zmieniła, więc teraz pytanie, czy cała firma miałaby teraz przez Devina przechodzić, żeby on wiedział o wszystkim, czy musielibyśmy uczyć ten model dalej jakichś tam kolejnych decyzji, które zapadły i share'ować jakoś ten model, pewnie da się to zrobić, fajnie byłoby jakby udało nam się pogadać z kimś, kto się zajmuje MLOpsem, który właśnie trochę spina tak naprawdę konieczność ciągłego przebudowywania i uczenia modeli w oparciu o zmieniający się otaczający świat, no nie wiem, jakby to miałoby się kosztowo spiąć, na to chwilę nie widzę tego. Czyli w ogóle jeszcze jest kwestia jedna, przepraszam Ci przerwę, ale też, no właśnie, jak Devin w ogóle, bo tutaj jest taki trochę hermetyczny przykład, w którym mamy inżyniera, który sobie… Tak, wszystkie te przykłady były hermetyczne, nawet ten z Computer Vision, on był ładnie wyekstrahowanym problemem, łącznie z przykładami, który jest po prostu do rozwiązania. Ale teraz pytanie, jak Devin będzie chodził na spotkania, które mogą być e-mailem, jak Devin będzie się odnajdywał w strukturach organizacji, na bazie których ten soft powstaje, tak? I integrował różne części, tak, bo zazwyczaj poszczególne części większego systemu odpowiadają przed różnymi stakeholderami, trzeba je ze sobą integrować, trzeba dograć w ogóle w jaki sposób się komunikuje ze sobą, kto do kogo się dostosowuje, jakie… nie wiem, jakby ta otoczka biznesowa tutaj mi się nie spina. I na koniec wrzuciłem jeszcze nam do notatek taki dość ciekawy screen z Twittera, bo bardzo podobna rzecz miała miejsce w branży kreatywnej związanej z ilustratorami, z konceptartystami i tak to bywa, że zazwyczaj rynki, które są mniej uregulowane są trochę przed tymi, które są uregulowane i tak jest w Chinach, gdzie znalazłem parę takich opinii, jedna jest bardzo ciekawa, w której okazało się, że jak zaczęto zastępować tych grafików, tych digital artistów prompt engineerami, którzy umieją do meet journey, czy tam do innych narzędzi dobrego w prompta wprowadzić, to się okazało, że no, rzeczywistość nie lubi próżni. Skoro tamtym nie płacimy tyle, ile płaciliśmy, to teraz ci AI prompt engineerowi widzą, że tamtych się już pozbyliśmy z rynku, to dawaj teraz tyle pieniędzy, co oni dostawali albo więcej i teraz jest problem, no bo teraz ja płacę gościowi, który w sumie nie wie skąd się to bierze, poza tym, że wrzuca jakiś kawałek tekstu i dostaje coś z powrotem versus miałem wcześniej gościa, któremu tyle samo płaciłem i on przynajmniej miał pomysł, miał jakąś wizję. Ja zrobiłem to, czy zrobiłem to tak, bo zainspirowałem się tym, miałem pomysł na to tak i nie wiem, ta kreatura ma na przykład dwie pary skrzydeł, bo ma taki jakiś tam background, a jej to po prostu ci wypluwa jakiś obraz. Jak bańka pęknie, nie będzie tak, że AI będzie się zajmował takimi rzeczami, wiesz, szybki krócik, coś tam wystawia ci ten, ale jak chcesz mieć kraftowe, a nie kule mocy, kula mocy to będzie AI taki, wiesz, typowy, każdy się tam może postawić i będzie tam mu robił, ale jak chcesz mieć kraftowy kodzik skrojony na miarę, takie haute couture, to będziesz miał faktycznie sztab inżynierów oprogramowania, którzy w oparciu o analizę jednak taki sznyt inżynieryjny, przede wszystkim ten ludzki feeling, że będziesz miał to poczucie, że to jednak jest handmade, nie, to było zrobione przez gościa, który faktycznie włożył cały swój pot po to, żeby ten system powstał i on jest taki, jak ja chciałem. Ja myślę, że po prostu te mniejsze rzeczy, których się nie opłaca zlecić jakiemuś software house'owi czy jakiemuś pojedynczemu programiście, po prostu będą przez to zastępowane. Dobra, słuchajcie, bo to miało być krótkie komentarie, a wyszło trochę dłuższe. Dajcie znać, co w ogóle myślicie o takiej formie, my też myślimy o zrobieniu takiego formatu trochę bardziej newsowego, trochę takiej prasówki, zobaczenia tego, co się w ogóle dzieje w branży. Tak, nie będziemy się skupiali, myślę, aż tak długo nad jednym tematem, ale chcemy Wam dawać takie TLDR, myślę, co jakieś dwa tygodnie, co się dzieje w branżunii i ogólnie też podsumować Wam jakieś fajne linki, żebyście mogli sobie przeczytać. Tak, i nasz krótki komentarz, ale naprawdę bardzo krótki, bez omawiania, tylko raczej czy uważamy, czy ciekawe, czy nie i jakieś tam TLDR, żebyście mieli... Tak, komentary też się będą pojawiały, ale pewnie po prostu w momencie, w którym będzie coś tak niesamowitego jak Devin. W ogóle dajcie znać, czy macie jakiś fajny pomysł, jak można rozwinąć skrót Devin, bo zapytałem w czatu GPT kilka błądów naprawdę mocnych i... Sprawdźmy, co Wy myślicie. Nazwa jest głupia ogólnie, nie podoba mi się. Tak, kończymy. A, i jak coś, to zapraszamy do subowania kanału, tak żebyście byli na bieżąco, chociażby z newsami, które będą się pojawiały. Myślę, że już w kwietniu się pojawi pierwszy odcinek taki z serii faktycznie newsów i co? Chyba tyle. Widzimy się na kanale za tydzień. Materiał, który miał być dzisiaj, pójdzie za tydzień. Będzie fajny, więc dla takich typowo zajawkowiczów inżynieryjnych myślę, że będzie co oglądać. Od nas wszystko. Dzięki. Elo.