A Internet Invisível
Essas informações ficavam escondidas, já que 85% dos usuários da Internet dependem desse tipo de site para encontrar o que desejam no emaranhado de informações contidas na Web.
Os robõs dos mecanismos de busca atuais podem apenas ver o que aparece na tela e não são capazes de entrar em bancos de dados. Assim, ficam fora de alcance as formações das páginas dinâmicas. Esse tipo de página é construída "ao vivo", dependendo do pedido do visitante.
De acordo com o estudo, há cerca de um bilhão de documentos catalogados em todos os mecanismos de busca e 1,5 milhão são acrescentados todos os dias. A Bright Planet garante que a "Web invisível" é de 400 a 550 vezes maior. Por exemplo, são ignorados grandes bancos de dados criados pela NASA, órgãos do governo e universidades. Muitas dessas informações são resultado de pesquisas, teses e estudos e não de páginas criadas para ação.
Essa limitação já está causando insatisfação entre os usuários. O editor do SearchEngineWatch.com (um site especializado na análise de mecanismos de busca) afirmou "Nesses dias, os mecanismos de busca são como a meteorologia. Todo mundo gosta de reclamar deles".
É claro que mesmo com esse problema a Internet continua sendo uma grande fonte de informações. A "Web invisível" é mais importante para quem busca de dados específicos. Por isso, a Bright Planet pretende vender sua criação, batizada de LexiBot, para cientistas e empresas. O robõ virtual custa quase U$ 90 e cada pesquisa demora de 10 a 15 minutos.
Além da nessidade de melhoria nos sistemas de busca, os dados extraídos pelo novo software fazem ressurgir uma questão que existe desde 1994, quando os sites de busca catalogavam pouco mais de 50 mil páginas: como usar essa grande quantidade de documentos. Hoje, a Web está ficando tão grande que em breve ganharão importância os mecanismos especializados. Várias empresas de Internet estão tentando desenvolver sistemas automáticos para extrair informações dessa grande massa de dados. É a volta do grande desafio de dar contexto ao conteúdo.
Atenção:
Não há censura de opinião nos comentários, mas o vc é o responsável pelo que escrever. Ou seja, aqui vale o Yoyow (You Own Your Own Words).
Lembre-se: Opinião é diferente de informação.
Informações sem fonte ou que não puderem ser checadas facilmente podem ser deletadas.
Serão apagadas sem dó mensagens publicitárias fora de contexto, spam usado para melhorar a posição de sites e outras iniciativas de marqueteiros pouco éticos.
Respeite as regras básicas Netiqueta.
Grosserias desacompanhadas de conteúdo, coisas off-topic e exagero nas gírias ou leet que dificultem o entendimento de não-iniciados tb não serão toleradas aqui.
Vou apagar sumariamente todos os comentários escritos inteiramente CAIXA ALTA, mensagens repetidas e textos que atrapalhem a diagramação do site.
Além de prejudicar, a leitura é falta de educação.
Não publique tb números de telefone, pois não tenho como checá-los. As mensagens com números de telefone serão apagadas inteiras.
Obviamente, qq conteúdo ilegal tb será deletado sem discussão.
Evite também mensagens do tipo "me too" (textos apenas concordando com o post anterior sem acrescentar algo à discussão).
Clique aqui para ver algumas dicas sobre como escrever um texto claro, objetivo e persuasivo.
Todas os comentários são considerados lançados sobre a licença da Creative Commons.
Se você não quer que seu texto esteja sob estes termos, então não os envie.
Comente