<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>amostra on W4LKER</title><link>https://walker.eco.br/tags/amostra/</link><description>Recent content in amostra on W4LKER</description><generator>Hugo -- gohugo.io</generator><language>pt-BR</language><copyright>This work is licensed under a Creative Commons Attribution 4.0 International License. W. de Barros Dantas Paniágua. 2025</copyright><lastBuildDate>Mon, 22 Sep 2025 15:54:05 +0000</lastBuildDate><atom:link href="https://walker.eco.br/tags/amostra/index.xml" rel="self" type="application/rss+xml"/><item><title>Analisando o dataset C4, uma amostra...</title><link>https://walker.eco.br/notas/bsky-20250922-analisando-o-dataset-c4-uma-amostra/</link><pubDate>Mon, 22 Sep 2025 15:54:05 +0000</pubDate><guid>https://walker.eco.br/notas/bsky-20250922-analisando-o-dataset-c4-uma-amostra/</guid><description>Analisando o dataset C4, uma amostra massiva da web usada para treinar IAs do Google e do Facebook, expõe uma mistura problemática de fontes. Contém vastas quantidades de conteúdo protegido, pirataria, dados de eleitores, blogs pessoais e uma gama de fontes de desinformação e discurso de ódio.</description></item></channel></rss>