A relevância da historiografia online

Raspagem de dados: Entenda o conceito e confira ferramentas

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

A importância da historiografia na web

O tema da história imediatamente traz à mente uma sala de aula empoeirada na qual professores contam histórias de guerra, realeza e civilizações perdidas nas areias do tempo.

Embora a história tradicional seja expressa como uma tapeçaria vibrante de eventos, datas, pessoas e lugares, muitas vezes esquecemos que a web tem a sua própria história rica e um legado a deixar às gerações futuras que necessita tanto de preservação como de reconhecimento.

Ao examinar os problemas actuais na forma como preservamos o nosso património digital e através de uma mudança significativa na nossa atitude em relação ao conteúdo da web, podemos esperar deixar aos futuros utilizadores da Internet algo tangível e útil.

A história não existe separada das nossas ações; é construído ao longo do tempo naquilo que escrevemos e gravamos, permitindo que aqueles no futuro analisem e aprimorem nosso trabalho. Abordar a nossa perspectiva atual do conteúdo da web como “dados descartáveis” é fundamental neste momento.

Evolução do compartilhamento de conhecimento

A transmissão e registro de conhecimento é uma tradição consagrada pelo tempo. Esta prática atravessou gerações, desde as primeiras pinturas rupestres da humanidade até ao armazenamento diligente de informação, tal como pode ser encontrado na Biblioteca de Alexandria, no Egipto.

No entanto, embora seja dada tanta ênfase à preservação da nossa rica história analógica, o nosso passado digital parece estar desaparecendo rapidamente ao nosso redor; e tal como a grande biblioteca egípcia que foi perdida no incêndio, ficamos agora com grandes lacunas na nossa compreensão de quanto da nossa atual cultura web surgiu.

0050 02 Creative CommonsCreative Commons, libertando o conteúdo das garras dos direitos autorais e da perda.

O site médio existe em uma única forma por um período de tempo antes de ser reinventado quando passa por uma reformulação do site, mas se valorizamos o conteúdo publicado, então a necessidade de preservá-lo deve ser imensurável.

Hoje, muitos argumentam que se não aparecer nos motores de busca ou se não houver um link claro para ele na web, então ele não existe mais. Por lei, o famoso Biblioteca de Alexandra preservou qualquer pergaminho que adquiriu, mas com a web, descartamos conteúdo antigo e útil se o número de visitantes não for alto o suficiente ou porque certas leis de direitos autorais nos proíbem de preservar conhecimento que logo será perdido.

Curadores e bibliotecários digitais

Seria injusto não mencionar alguns esquemas actuais para proteger conteúdos valiosos da Web contra o descarte, como o Arquivo da Internet e, até certo ponto, Wikipedia e Google.

Contudo, se olharmos para Geocidades sendo fechadaspodemos ver os danos que o desaparecimento de um serviço web pode causar à nossa cultura web. Com o serviço de favoritos Delicioso sendo ameaçado de extinçãotambém poderemos ver marcadores valiosos de seus usuários perdidos.

O conhecimento e a marca da nossa história servem para ensinar outros sobre o desenvolvimento da web, e devemos aceitar o nosso papel como curadores e bibliotecários deste mundo digital moderno.

0050 03 arquivo da internetO Internet Archive é como um museu de sites antigos, mas não salvou tudo.

Como profissional da web, ver o conteúdo da web desaparecer me deixa triste, mesmo que sua relevância e precisão mudem com o tempo.

À medida que produzimos cada vez mais conteúdo, encontrar verdadeiros tesouros na web fica cada vez mais difícil. Embora um blog comum possa ter apenas fragmentos de ouro, ele ainda reflete o mundo diverso que habitamos. O objetivo de possuir um site é aumentar a visibilidade, mas muitos ainda deixam suas criações desacompanhadas, criando links quebrados e mortos, páginas órfãs e sistemas de navegação e arquivamento deficientes.

Deveríamos fazer mais para melhorar nossos sites e mostrar o bom conteúdo de nossos arquivos, mesmo que seja apenas para revisitar um artigo ou assunto a partir de uma perspectiva atual.

O perigo dos dados descartáveis

Criamos uma sociedade em que a informação e a opinião não são valorizadas a longo prazo. Como resultado, ficamos sem infraestrutura para garantir a sustentabilidade desse conteúdo.

Por exemplo, pouco existe em websites criados na década de 1990, e o que pode ser encontrado é muitas vezes desarticulado e disperso; imagine o estado do nosso conteúdo da web daqui a 20 anos!

Paradoxalmente, valorizamos muito o nosso próprio trabalho, muitas vezes gastando horas e horas criando belos sites e conteúdos incríveis, e ainda assim nos esquecemos deles após seus 15 minutos de fama.

0050 04 arquivo bbcA BBC arquiva informações antigas, mas mesmo isso não é seguro para sempre.

Para acordar desta mentalidade de desperdício, temos que ser críticos na nossa avaliação da história moderna da web. Devemos reconhecer que à medida que a Web muda, os formatos mudam e o consumo de meios de comunicação social também se altera, e precisaremos de manter algum nível de controlo sobre os efeitos das tendências populares.

Links perdidos e impérios perdidos

Como profissional da web ou proprietário de site, você pode fazer muito para reduzir o desaparecimento do conteúdo do seu site. Certas práticas trazem benefícios profundos e podem dar aos usuários motivos adicionais para retornar ao seu site. Se conseguirmos expor a história de um site, proporcionamos uma experiência mais enriquecedora e cheia de conteúdo de qualidade.

A primeira coisa a fazer para promover um arquivo saudável é eliminar os links mortos que se acumulam ao longo do tempo. Esse desperdício é fácil de detectar com ferramentas como o Xenu Link Sleuth (freeware), que verifica cada conteúdo de um site.

Registrar um site com milhares de páginas pode ser bastante complexo, mas manter um esquema de navegação eficaz e um mapa do site atualizado é fundamental para uma boa arquitetura de informação.

0050 05 xenoFerramentas automatizadas podem vasculhar seu site e relatar links inativos.

Em seguida, podemos garantir a sobrevivência de nosso conteúdo conectando cada página ao resto do site e listando todas elas em um mapa do site (bem como criando um arquivo XML de Sitemaps legível por robôs). As páginas desconectadas – páginas que não possuem links ativos restantes para elas – são órfãs. As páginas órfãs raramente indexam bem, o que impacta negativamente a localização do seu conteúdo e sua utilidade para as gerações futuras.

0050 06 mapas do siteOs mapas do site podem ser facilmente produzidos usando um aplicativo, mas você pode querer codificar um você mesmo.

Se você é o tipo de pessoa que estremece ao pensar em seu trabalho anterior, considere tornar as revisões ativas de seu conteúdo antigo visíveis em seu site; entretanto, preserve o original usando alguma forma de sistema de controle de versão.

Se você redesenha seu site regularmente e altera o conteúdo com frequência, mantenha as páginas mais antigas disponíveis para usuários nostálgicos ou interessados ​​em ver as versões anteriores. Expor revisões (como um arquivo de histórico de versões) também pode ser muito benéfico para acompanhar o progresso e a evolução dos sites.

0050 07 versões anterioresAlgumas pessoas permitem que os usuários revisitem versões anteriores do layout de seus sites como uma forma de mostrar seu talento em evolução.

Doar conteúdo publicado é outra prática a considerar. Embora republicar material antigo ad infinitum não seja sensato (porque criaria conteúdo duplicado para os mecanismos de pesquisa indexarem e talvez fosse considerado spam), pode chegar um momento em que você feche, mude de direção ou reformule seu site.

Nesses casos, considere doar suas postagens para outros sites (pense nisso como aquisição de conteúdo); você poderia ganhar algum dinheiro com isso e liberar dados úteis.

0050 08 WikipédiaCertas peças de interesse podem ser úteis para a Wikipédia ou podem ser doadas em outro lugar.

Embora a doação de conteúdo desatualizado ou inútil possa ajudá-lo a limpar sua presença na web, os sites ou serviços que recebem esse material antigo podem não ser capazes de gerenciá-lo de maneira eficaz, especialmente se ele chegar a uma taxa insustentável; isso poderia, por sua vez, levar a links de imagens inativos, conteúdo desatualizado e um aumento de erros 404. Em vez disso, tente usar o material arquivado de outras maneiras, talvez promovendo artigos anteriores, como uma espécie de retrospectiva.

0050 09 seis revisõesEste é o primeiro artigo publicado no Six Revisions, mas ainda hoje pode ajudar vários leitores.

Finalmente, a precaução mais importante para garantir a sobrevivência do seu conteúdo é fazer backup dele. Até hoje, muitos sites ainda não possuem um processo substancial para arquivar e fazer backup de seu conteúdo. O que acontece se o seu site for hackeado? E se o seu computador travar? Se a história da computação nos mostrou alguma coisa, é que os dados desaparecem cada vez mais como resultado de falhas de computador e do envelhecimento de um site ou da tecnologia da web.

Historiografia para o povo

A web está em constante mudança e a sua história está a ser apagada, reescrita e perdida em arquivos mal conservados.

Conteúdo de alta qualidade – até mesmo a reflexão pessoal de um indivíduo sobre o mundo em seu blog – nunca perde valor. É claro que abafar o spam e o boato ajuda, mas se valorizarmos um ecossistema digital saudável, então nos concentraremos na produção de coisas que contribuam para a evolução da nossa biblioteca virtual mundial.

O conteúdo que produzimos proporcionará às gerações futuras uma visão fascinante de como a web evoluiu ao longo do tempo e de como os profissionais da web e as pessoas comuns realizaram suas tarefas diárias.

Não devemos construir websites apenas para o aqui e agora, esquecendo os erros e acertos daqueles que vieram antes de nós. Ao preservar o passado e documentar o desenvolvimento da web, estamos nos imortalizando, garantindo que não nos tornaremos mais um povo que simplesmente cairá no esquecimento.

Conteúdo relacionado

  • A história dos navegadores da web
  • A evolução do web design
  • A pirâmide da estratégia da Web: uma estratégia da Web bem equilibrada

FAQ sobre a Historiografia na Web

Como a evolução do compartilhamento de conhecimento influencia a preservação digital?

Qual é o papel dos curadores e bibliotecários digitais na proteção do conteúdo da web?

Por que os dados descartáveis representam um perigo para a história digital?

Como os links perdidos e os impérios perdidos afetam a preservação do conteúdo na web?

Qual é a importância da historiografia para garantir a sobrevivência do conteúdo digital?

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!