Esta semana, o Blog do The New York Times anunciou a abertura da API para busca de informações em todo o site. Isto torna possível para explorar a primeira ocorrência do termo “dados visualização”, ou identificar artigos que apareceram na página frontal e mencionado “blog”. O New York Times tem agora várias APIs disponíveis, incluindo (pesquisáveis) artigos, melhores vendedores (livros), comunidade (comentários), congresso ( dados de votação), filme opiniões e dicionários (haverá um infografico através da palavra “media interativos ” que também será contemplado no sistema de busca.
A base de dados do jornal contém mais de 2/8 milhões artigos desde 1981 até hoje. Cada artigo compreende aproximadamente 35 campos de metadados (dados sobre dados) pesquisáveis, a partir do título e assinatura para imagem miniatura e região geográfica.
Segundo o Blog, o internauta poderá:
* Localizar as receitas que têm uma imagem associada;
* Localizar a primeira ocorrência de “internet”
* Veja exemplos da expressão “perda de emprego”, por mês, para 2008
* Procurar a expressão “bolsa” em todos os artigos que estão marcados como uma revisão na seção Livros
* Localizar artigos que mencionam “Iraque” no título e têm relacionado multimídia
* Identificar artigos que apareceram na primeira página e referiu a palavra digitada/buscada.
Além disso, a API atualmente suporta os seguintes tipos de consulta:
* Período: todos os artigos de X para Y data data
* Campo pesquisa: pesquisa em qualquer determinado número de domínios, por exemplo, título: obama assinatura, por exemplo;
* Conjunto e disjunção (AND e NOT) operações, por exemplo, yankees baseball – “Red Sox”
* Encomendas por mais próximo (variável ranking algoritmos), mais recente e mais antigo
* Pesquisar facetada – (nota: esta é realmente a diversão “usuário avançado” característica.