amostra on W4LKER

amostra on W4LKERhttps://walker.eco.br/tags/amostra/Recent content in amostra on W4LKERHugo -- gohugo.iopt-BRThis work is licensed under a Creative Commons Attribution 4.0 International License. W. de Barros Dantas Paniágua. 2025Mon, 22 Sep 2025 15:54:05 +0000Analisando o dataset C4, uma amostra...https://walker.eco.br/notas/bsky-20250922-analisando-o-dataset-c4-uma-amostra/Mon, 22 Sep 2025 15:54:05 +0000https://walker.eco.br/notas/bsky-20250922-analisando-o-dataset-c4-uma-amostra/Analisando o dataset C4, uma amostra massiva da web usada para treinar IAs do Google e do Facebook, expõe uma mistura problemática de fontes. Contém vastas quantidades de conteúdo protegido, pirataria, dados de eleitores, blogs pessoais e uma gama de fontes de desinformação e discurso de ódio.