Menu
O mnie Kontakt

Fireship opublikował fascynujący film dotyczący jednego z najtajniejszych sekretów w technologii — algorytmu rankingowego Google. W wyniku przypadkowego wycieku dokumentów na GitHubie, mamy teraz unikalny wgląd w to, jak naprawdę działa ten algorytm. Autor filmu wzywa do analizy tych dokumentów, zastanawiając się, czy Google wciąż podtrzymuje swoje motto „Nie bądź zły”. Z tego wideo dowiadujemy się, że algorytm rankingowy nie zawsze był tak uczciwy, jak Google chciałby, abyśmy wierzyli. Kiedy Google powstał w latach 90-tych, opierał się na założeniu, że wyszukiwarka może działać całkowicie na podstawie algorytmu, co wówczas było rewolucyjnym pomysłem. Wcześniejsze wyszukiwarki, takie jak Ask czy Yahoo, korzystały z ludzkiej kuracji, co niestety skutkowało brakiem skali. W miarę upływu lat SEO zyskało na znaczeniu, ale manipulacja rangowaniem stała się coraz łatwiejsza, zwłaszcza przez spamowanie linkami zwrotnymi.

Z czasem algorytm Google ewoluował i zaczął wymagać tworzenia wysokiej jakości treści, by uzyskać wysokie notowania. Autor zauważa, że w obliczu takiej konkurencji wielu fachowców od SEO zaczyna się martwić o swoje utrzymanie. Niepokojące jest to, że niektóre z oświadczeń Google dotyczących funkcjonowania algorytmu są koncepcyjne. Warto zaznaczyć, że chociaż Google przyznał, że dokumenty są prawdziwe, nie wiadomo dokładnie, co one zawierają. Mogą to być stare materiały treningowe lub fałszywy ruch, mający na celu ochronę algorytmu. Google twierdzi, że te dokumenty są wyjęte z kontekstu, przestarzałe i niepełne.

Jednym z najbardziej kontrowersyjnych odkryć w dokumentach jest metryka `site authority`, która zdaje się zaprzeczać zaprzeczeniom Google o niestosowaniu autorytetu domeny do ustalania rankingów. Również ujawnione informacje obalają twierdzenie, że kliknięcia nie są czynnikiem rankingowym, co ujawniono podczas pozwu antymonopolowego Google. System zwany NavBoost zbiera różne interakcje użytkowników takie jak kliknięcia, przewijanie oraz inne sygnały, co sugeruje, że kliknięcia mogą mieć istotny wpływ na wyniki wyszukiwania.

Inne zaskakujące wnioski z dokumentów polegają na tym, że dane zbierane od użytkowników w przeglądarce Chrome mogą wpływać na ranking, co wydaje się być logiczne. Wspomniano też, że wysokiej jakości linki zwrotne wciąż mają znaczenie, chociaż nie w taki prosty sposób, jak kiedyś. Autor zwraca uwagę, że w SEO mogą brać również udział ludzie, którzy oceniają i klasyfikują treści krytyczne w oparciu o różne metryki. Współczesne Google również zmaga się z problemem wartości treści, ponieważ wiele informacji pochodzi od dominujących stron takich jak Wikipedia, co zagraża mniejszym witrynom.

Ogólnie rzecz biorąc, ujawnione materiały przedstawiają złożoną i niepokojącą wizję działania Google. Z punktu widzenia autora, sytuacja ta podważa zaufanie do Google, a jednocześnie pokazuje zmieniający się krajobraz SEO. Tradycyjne SEO zdaje się umierać w obliczu rosnącej dominacji algorytmów AI i mechanizmów reklamowych. Na czas pisania tego artykułu, film ten zdobył już ponad 1.396.141 wyświetleń i 56.150 polubień, co świadczy o ogromnym zainteresowaniu tym tematem i potrzebie lepszego zrozumienia, jak naprawdę działa wyszukiwanie w Internecie.

Toggle timeline summary

  • 00:00 Wprowadzenie do algorytmu rankingowego Google'a jako ściśle strzeżonej tajemnicy.
  • 00:05 Obawy dotyczące potencjalnych konsekwencji, jeśli sekrety algorytmu zostałyby ujawnione.
  • 00:12 Przypadkowy wyciek dokumentów na GitHubie, który dostarcza informacji o mechanizmach wyszukiwania Google'a.
  • 00:17 Dyskusja na temat szczerości Google'a w odniesieniu do jego algorytmów.
  • 00:30 Zapowiedź treści wideo opartej na wyciekłych dokumentach.
  • 00:44 Krótka historia powstania Google'a i początkowe podejście algorytmiczne.
  • 01:09 Ewolucja taktyk SEO w celu wykorzystania algorytmu Page Rank Google'a.
  • 01:22 Obecne zapotrzebowanie na wysokiej jakości treści, aby osiągnąć wysokie pozycje w wyszukiwarkach.
  • 01:38 Niepewność dotycząca autentyczności i kontekstu wyciekłych dokumentów.
  • 02:06 Sprzeczność w twierdzeniach Google'a dotyczących autorytetu domeny w rankingach.
  • 02:15 Odkrycie o ważności kliknięć jako czynnika rankingowego.
  • 02:48 Ciągłe znaczenie backlinków w rankingach wyszukiwania mimo zmian w algorytmach.
  • 02:55 Wykorzystanie ludzkich oceniających do oceny i walidacji treści.
  • 03:18 Krytyka obecnego stanu wyszukiwania w sieci zdominowanego przez autorytatywne strony.
  • 03:37 Podsumowanie wpływu wycieku i znaczenia SEO.

Transcription

One of the most tightly held secrets in all of technology is how the Google search ranking algorithm actually works. If the secret ever got out, Google would implode because SEO experts would get every keyword to link to a landing page for fake Viagra pills. Unfortunately, Google accidentally pushed thousands of documents to GitHub of all places, a website owned by their Bing rival Microsoft, that provide an unprecedented look behind the curtain of Google search. As a bit of an SEO guru myself, I was left shocked and utterly devastated when I found out that Google has not been totally honest about the algorithm. In today's video, we'll take a look at what's inside these documents and find out if Google has been living up to its credo of, Don't be evil. It is May 31st, 2024, and you're watching The Code Report. When Google was founded in the late 90s by Larry and Sergei at Stanford, it was all based on the idea that a search engine could be handled entirely with an algorithm, which at the time was a radical idea that differed from search engines like Ask, Jeeves, and Yahoo, which relied on unscalable human curation. They wrote a legendary paper called The Anatomy of a Large-Scale Hypertextual Web Search Engine that detailed something called the Page Rank Algorithm. Every web page has an initial rank, and that ranking grows and improves based on the number of high-quality incoming backlinks. This worked pretty well at first, but eventually SEO gurus realized that all you had to do was spam a bunch of backlinks with the anchor text of your keyword to dominate the extremely valuable top search result placement. However, over the years, the algorithm has become more complex, and nowadays you actually have to make really good content to get the top ranking. But that's too hard, and SEO gurus still need to put food on their families. And sadly, many of the statements Google has made about how the algorithm works appear to be lies. It's important to point out that although Google has confirmed that these documents are real, we still don't really know exactly what they are. They could be internal training documents, they could be old and outdated, or it could be a false flag in Google's 5D chess game to protect the algorithm. Officially though, Google has implied that these documents are out of context, outdated, and incomplete. Another interesting point is that the leaked code uses the Elixir programming language, which is not a language that Google would normally use internally. But now let's get into the true lies. In the past, Google has denied the use of domain authority for ranking. However, in these documents, there's a site authority metric that seems to contradict that claim. Another highly sus thing Google has said in the past is that clicks are not a direct ranking factor. Well, we actually learned a while ago that that's a fib during Google's antitrust lawsuit, which revealed a system called NavBoost, or Glue, and aggregates a bunch of different interactions like clicks, hovers, scrolls, swipes, etc. What's a unicorn click? NavBoost was confirmed once again in the leaked documents, which it defines as click and impression signals for craps, so it looks like clicks are actually important, not surprisingly. Another potential fib is that it looks like, based on these documents, that data collected from users in the Chrome browser affects search rankings. Not surprised. And another thing that's not surprising is that backlinks still matter. It's not the simple page rank algorithm that it used to be, but getting those high-quality backlinks is still important. And finally, the most shockingly unsurprising thing is that actual humans are used for rating and whitelisting critical content. Fields like IsCovidAuthority or IsElectionAuthority are used for this. And through my investigation, I also found this one called WebRefCompactFlatPropertyValue that appears to be hiding the true shape of the Earth. Now, I'm no urologist, but overall, this leak looks pretty bad. I can't believe a big corporation would lie to us, but the real tragedy here is the web itself. In the early days, Google was the best way to find interesting websites and forums created by random weirdos, but nowadays, the top rankings are almost entirely dominated by authoritative sites like Wikipedia and Reddit, in addition to paid advertisers. And it's like, what is even the point of a website nowadays if AI is just going to summarize your website anyway and never get you a click-through? SEO has been dead for a long time, and now with this leak, it's even more deader. This has been The Code Report. Thanks for watching, and I will see you in the next one.