AI Agent without coding using N8N + Groq (film, 14m)
In the latest video, Generatywni addresses the topic of AI agent courses that have flooded ads recently on the internet. Instead of paying between 1000 to 2000 PLN for complex training, the author highlights that the basics of this technology can be grasped in just 15 minutes for free. The video demonstrates, step by step, how to build a simple, yet functional AI agent capable of performing basic tasks like sending emails and doing simple calculations. The key tools used in the process are N8n and Grok, allowing the creation of straightforward automation without breaking the bank.
The first step discussed by Generatywni is utilizing N8n as a platform for automation that operates on open source principles. The creator shows how to set up a trigger with just a few clicks, which will serve as the interface for the agent. In the next stage, AI models from the Grok provider are incorporated, which is fast and offers free plans. This way, users can communicate with their agent while also giving it memory to not forget the context of each interaction. By using Grok for the chat model and simple memory, a basic tool can be created, which starts engaging in conversations.
Once the agent is ready to operate, the author demonstrates how to add the ability to send email messages through the Gmail tool. It is crucial to configure the credentials correctly, which the author explains in a simple manner. During the demonstration, Generatywni sends an email, proving the effectiveness of the solutions created. Users can easily implement their workflows, making the entire undertaking both engaging and practical.
Generatywni also points out potential issues related to mathematical calculations in AI models. Mathematical values can be misinterpreted by models, making training the agent to correctly use a new calculator tool essential. The author discusses how to create system instructions that help the agent to find missing information. With that, the agent can be more responsive and functional, significantly increasing its usability.
Finally, Generatywni also shows how to publicly share the created agent, which opens doors for users wanting to showcase their achievements. He concludes that creating such a simple agent takes no more than a few minutes, and instead of investing in expensive courses, it’s worth trying to build such a project independently. The video currently has 2480 views and 132 likes, indicating that the topic is interesting and relevant among viewers, further fostering a discussion about the accessibility of modern technology for everyone.
Toggle timeline summary
-
The speaker expresses frustration over constant advertisements for AI agent courses.
-
They mention that the basics of AI technology can be learned in just 15 minutes and for free.
-
The speaker demonstrates how to build a simple yet functional AI agent.
-
Introduction of two tools: N8n for automation and Grok for language models.
-
Instruction on how to set up a trigger in N8n for the AI agent to communicate.
-
The chat message option is selected as the interface for interaction.
-
The agent is assigned a thinking model from Grok and simple memory for maintaining context.
-
The speaker shows how to register on Grok and obtain an API key.
-
After completing the setup, the AI agent is tested with a simple greeting.
-
Discussion on adding tools so the agent can perform tasks, starting with Gmail.
-
Instructions for creating new credentials for Gmail access.
-
The importance of configuring dynamic email and subject fields in the Gmail tool.
-
Validation that the AI agent successfully sends an email.
-
The speaker addresses the agent's limitations in mathematical calculations.
-
Setting system messages to define the agent's identity and behavior.
-
Final test where the agent successfully calculates and emails a result.
-
Confirmation that the email was received successfully.
-
Instructions for sharing the AI agent with others by making it publicly accessible.
-
Encouragement to expand the agent’s capabilities beyond the basics.
-
Final remarks highlighting the simplicity of creating an AI agent.
-
Request for viewer thoughts in the comments about their use of N8n.
Transcription
Słuchajcie, ostatnio mam wrażenie, że gdzie się nie obrócę, tam wyskakuje mi reklama kursu o agentach AI. Zostań ekspertem w 3 tygodnie, zbuduj armię autonomicznych botów i oczywiście za jedyne 1000-2000 złotych. I wiecie co? Trochę mnie to wkurza, bo prawda jest taka, że podstawy tej technologii możecie ogarnąć w kwadrans i to zupełnie za darmo. I dzisiaj pokażę wam, jak zbudować takiego prostego, ale w pełni funkcjonalnego agenta AI, który będzie potrafił liczyć i wysyłać maila. Bez marketingowego bełkotu i bez płacenia fortuny. Zaczynamy. No dobra, to do roboty. Będziemy używać dwóch narzędzi. Pierwsze to jest N8n, to jest taki Zapier albo Make, ale na sterydach. Jest na zasadach open source i można go postawić u siebie lokalnie. To taka platforma do automatyzacji, idealna do stawiania różnych serwisów. Drugie narzędzie to Grok, to jest dostawca modeli językowych. I zapytacie, dlaczego Grok? Bo jest bardzo szybki i na ten moment ma koiny darmowe plany. Okej, to jest nasz plac budowy w N8n i zaczynamy od tego, jak w ogóle będziemy z naszym agentem rozmawiać. W tym celu klikamy plusik w prawym górnym rogu, czyli tutaj i szukamy triggera, czyli wyzwalacza. W naszym wypadku to będzie ta opcja tutaj, czyli on chat message. Wybieramy ją i to będzie nasz interfejs. Póki co nic tutaj nie zmieniamy i wracamy do głównego widoku. Skoro mamy trigger to następnie klikamy w plusik wychodzący z tego naszego wyzwalacza, czyli tutaj. I wybieramy kolejno, AI oraz AI Agent. I to jest serce naszego bota, na razie zostawiamy domyślne ustawienia, wracamy do głównego widoku. Agent potrzebuje jeszcze dwóch rzeczy, modelu do myślenia i pamięci, żeby nie miał amnezji po każdym pytaniu. Jako model, tak jak mówiłem, wybieramy dostawcę Grok, w tym celu klikamy tutaj, chat model, plusik i Grok chat model. Żeby zdobyć dane dostępowe musimy otworzyć nową stronę, to jest konsol.grok.com oraz się zarejestrować, bądź zalogować jeśli już macie konto. Klikamy po prostu Login with Google, wybieramy nasze konto, potwierdzamy. Ok, jesteśmy zarejestrowani, klikamy tutaj Create API Key. Ok, mamy klucz, kopiujemy go, wracamy z powrotem do NA10, tą stronę już możemy zamknąć. Klikamy Create New Credential, klejamy nasz klucz, klikamy Save. Dostaliśmy potwierdzenie, że jest wszystko w porządku, mamy już ustawienia zaakceptowane. Następnie wybieramy model, w naszym wypadku to będzie Lama4 i to będzie Lama Maverick. Ten model sobie wybierzemy, na nim będziemy pracować i wracamy do naszego głównego menu z powrotem. Potrzebujemy jeszcze dodać pamięć, czyli klikamy Memory i wybieramy Simple Memory. Zostawiamy domyślną wartość, czyli 5 ostatnich interakcji i to nam wystarczy, żeby agent pamiętał kontekst naszej rozmowy i to w zasadzie tyle. Wracamy do głównego menu. OK, sprawdźmy czy to w ogóle działa. Otwórzmy sobie tutaj czat i wpiszmy np. Cześć. Jak widzimy działa, gratuluję. Właśnie stworzyliście swojego pierwszego agenta, ale na razie on potrafi tylko gadać. Dajmy mu jakieś narzędzia, żeby mógł faktycznie coś robić. W tym celu wracamy do edycji noda AI Agent i klikamy tutaj w ten plusik. Pierwszym narzędziem, które dodamy do naszego agenta będzie Gmail. W tym celu wpisujemy sobie po prostu Gmail i wybieramy Gmail Tool. Prawdopodobnie nie będziecie mieli skonfigurowanych kredensiali tutaj. Jest to bardzo proste, ale chwilkę zajmie, dlatego pokażę Wam tutaj na co zwrócić uwagę. Czyli klikamy Create New Credential, a następnie klikamy Open Docs i jest tutaj bardzo ładnie wszystko rozpisane, co trzeba zrobić, żeby przejść cały ten proces. To wygląda tylko skomplikowanie, ale nic takiego trudnego. Także to zostawiam Wam do przejścia. Załóżmy, że mamy już skonfigurowane kredensiale, to teraz pójdźcie na bardzo ważne rzeczy, mianowicie pola Tool, Subject oraz Message. Zamiast wpisywać sztywny adres e-mail czy temat, klikamy tą małą ikonkę z boku i to mówi agentowi, jak będziesz chciał wysłać maila, to sam się domyśl albo zapytaj uzera o dane. I to jest cała magia agentów, one same decydują, jak użyć tego narzędzia. Więc zaznaczamy sobie tutaj przy każdym, czyli przy polu Tool, przy polu Subject i przy Message. Skoro mamy to zaznaczone, wracamy z powrotem do naszego głównego widoku. Jesteśmy tutaj z powrotem. OK, to zróbmy mały test. Napiszmy mu, wyślij maila do generatywnimauta.gmail.com, wstajemy za tematem test od agenta AI i treści chodzi o działanie. OK, sprawdźmy, czy to działa, wyślijmy. Wiadomość została wysłana do generatywnimauta.gmail.com z tematem oraz treścią. Ciekawe, czy to do nas dojdzie. I jak widzicie, dostaliśmy już takiego maila, czyli to działa. Więc tak, agent zrozumiał nasze polecenie, wyciągnął z niego wszystkie potrzebne dane i użył narzędzia Gmail. Proste? Proste. No dobra, a co z tym liczeniem? I modele językowe, nawet te najlepsze, potrafią się wyłożyć na prostym mnożeniu. To tak zwane halucynacje w wersji matematycznej. Ale możemy łatwo to naprawić, dodając mu kalkulator. W tym celu wracamy z powrotem tutaj do agenta. Jeśli chcemy ułożyć te nody, nie podobają nam się na ułożeniu na tym scenariuszu, znaczy na tym workflow, to po prostu klikamy sobie w tą gniotelkę tutaj i wtedy nam się ładnie to wyrównuje. Więc wracając, klikamy tool i dodajemy kalkulator. I tyle. I teraz bardzo ważna rzecz, mianowicie prąd systemowy dla agenta. I to jest jego konstytucja, jego charakter. W głównych ustawieniach noda AIAgent, czyli klikamy sobie dwa razy ten node tutaj, szukamy pola system message. Ono się będzie znajdowało tutaj, jeśli klikniemy sobie add option i wybierzemy system message. I w tym polu tutaj kasujemy to co jest wpisane i dajemy nasz prąd. W tym wypadku to będzie coś takiego. Jesteś pomocnym i konkretnym asystentem AI o imieniu Grzegorz GPT. Twoim celem jest wykonywanie zadań dla użytkownika. Potrafisz wysyłać maile i wykonywać obliczenia matematyczne. Zawsze używaj narzędzia do liczenia, gdy prośba zawiera jakiekolwiek działania matematyczne. Jeśli do wykonania zadania, na przykład wysłania maila, brakuje Ci jakiejś informacji, na przykład adresu odbiorcy, tematu, zawsze dopytuj nie o użytkownika w uprzejmy sposób. Taki prąd oczywiście nie jest idealny, ale ustawia jasne zasady gry. Agent wie kim jest, co potrafi i jak się ma zachowywać, gdy czegoś nie wie. To jest absolutna podstawa i zachęcam do rozbudowy takiego prompta we własnym zakresie. I no to finałowy test. Zobaczymy, czy nasz agent nie da się oszukać. Mogę sobie zawsze zresetować tutaj nasz czat, czyli w tym wypadku klikamy sobie reset. Sprawdźmy, co się stanie, jeśli wkleimy mu coś takiego. Cześć, ile to jest 15 plus 5 razy 3, a potem wynik wyślij mailem. I zobaczcie, co się stało. Agent zrozumiał, że brakuje mu danych i potrzebuje adres e-mail oraz temat wiadomości, więc podajmy mu, czyli tak generatywni.mail.on, generatywni.mail.on, a temat damy sobie matma. Sprawdźmy, jak się zachowa nasz agent. I wiadomość z wynikiem, czyli poprawnie sobie policzył to, co potrzebował. Została wysłana na adres generatywni.mail.on z tematem matma. Czy mamy takiego maila? Tak, zobaczcie, dostaliśmy to. Jest wszystko ok, zrozumiałem. Możemy sobie zawsze podpatrzeć, co nasz agent robił, jakie narzędzia użył, czyli w tym wypadku widzimy, że był użyty kalkulator. Jak widzimy tutaj po prostu zapytał te narzędzia o wynik tego działania. I również był użyty gmail. Mamy status, czy zostało to wysłane, czy nie. Więc zawsze możemy całą historię sobie tutaj podglądać. Ok, jak widzicie mamy agenta, który nie dość, że korzysta z narzędzi, to jeszcze potrafi prowadzić dialog, żeby uzyskać brakujące informacje. Ile to zajęło? Kilkanaście minut pykania. A co w przypadku, kiedy chcielibyśmy pochwalić się naszym agentem wśród znajomych, pokazać im to, co zbudowaliśmy? To akurat w Nintenie nie jest bardzo skomplikowane. Musimy tylko zaznaczyć jedną opcję. Więc tak, wchodzimy sobie w nasz trigger, tutaj w te dymki i zaznaczamy opcję, żeby czat był publicznie dostępny. Czat możemy osadzić na naszej stronie internetowej, czyli embedded chat oraz możemy mieć go w formie hosted chat, który po prostu będzie na adresie naszej instancji niten. Możemy tutaj autentykację wybrać. Gorąco zachęcam do zabezpieczenia naszego czata. Nie wystawiajcie po prostu gołych adresów w internet, bo może się to źle skończyć. Możemy spersonalizować pierwsze wiadomości naszego agenta i mamy tutaj parę ciekawych opcji. Zachęcam do eksploracji we własnym zakresie, bo naprawdę można fajnie spersonalizować to. Tak, jak sprawdzić, czy to działa? Proponuję skopiować adres tego czata tutaj, ale jeszcze wcześniej zrobić tak, żeby ten scenariusz był aktywny. Zaznaczymy OK. Scenariusz jest aktywny, jest zapisany i teraz skopiujemy sobie adres tego webhooka. Wystarczy na niego kliknąć i wejdziemy na tę stronę. Jak widzimy, jest dostęp do naszego czata i możemy napisać, cześć, kim jesteś. Jak widzimy, to jest Grzegorz GPT. Możemy go poprosić na przykład, policz ile to jest, plus tyle. Jak widzimy, to jest taka duża suma i poprosimy go teraz, żeby wysłał to na nasz adres e-mailowy. I wyślij ten wynik na adres generatywni.e-mail.com. Temat wymyślony sam. OK, sprawdźmy, czy to się udało. Jak widzimy, działa. Nasz agent działa. Jest udostępniony na zewnątrz. Oczywiście gorąco zachęcam do rozbudowy tego. To jest tylko takie wprowadzenie. Prąd systemowy oraz zabezpieczenia są tylko w wersji pokazowej. Naprawdę rozbudujcie to troszeczkę. Chciałem tylko Wam pokazać cały flow tutaj, jak można bardzo szybko i bardzo łatwo zbudować takiego prostego agenta, który ma dostęp do narzędzi. Jeśli chcecie, to możecie tutaj właśnie eksperymentować. Dodawajcie mu różne narzędzia. Naprawdę w Nitenie tego jest mnóstwo. Obsługuje też serwery MCP. Tak że naprawdę możecie budować bardzo fajne narzędzia bardzo łatwym kosztem. Znaczy bardzo łatwym kosztem. Bardzo szybkim kosztem. I jak sami widzicie, jest to bardzo proste. No i zobaczcie, mamy to. Prosty agent zbudowany praktycznie za darmo w czasie krótszym niż przerwa na kawę. I czy to jest armia autonomicznych botów, która obiecuje Wam kursy za 2000? Absolutnie nie. Ale jest to solidna, działająca podstawa, którą możecie teraz rozbudować o kolejne narzędzia. Przykładowo dostęp do API, przeszukiwanie internetu. Tak naprawdę cokolwiek chcecie. I celowo dodałem tutaj dostęp do maila, co nie jest dobrą praktyką. Zdecydowanie. Ponieważ model może się mylić i czasami wysyłać zupełnie losowe treści na przypadkowe adresy mailowe. I warto mieć tego świadomość. Pamiętajcie, że modele nie są deterministyczne. Chodzi o to, żeby zrozumieć, że to nie jest żadna czarna magia. To jest po prostu logiczne składanie klocków. I zamiast płacić komuś za marketingową papkę, lepiej poświęcić godzinę, żeby samemu to przeklikać. Dajcie znać w komentarzach, co o tym myślicie i czy używacie Nytena do czegoś ciekawego. Udanego dnia.