martes, 30 de junio de 2015

La curación de contenidos en Internet

Búsqueda de información en Internet: curación de contenidos





Entre las áreas temáticas que domino, entre aquellos ejes temáticos dentro del área seleccionada que considero ser entendido y que podría aportar "mi voz personal" o puntos de vista, o contribuir con un "valor agregado" se encuentran:

- 10 posibles temas para una curación de contenidos: Geografía, Medio Ambiente, Geopolítica, Ufología, Actividad Aeroespacial, Tecnología, Seguridad y Defensa, Relaciones Internacionales, Educación.

- Reduzco la selección a 5 y luego a 3: Geopolítica, Ufología, Seguridad y Defensa, Actividad Aeroespacial, Medio Ambiente;  Geopolítica y Ufología.

El tópico final elegido es: Ufología.
A continuación desarrollé una página en Scoop.it con el tema seleccionado y al menos 10 posts:

martes, 23 de junio de 2015

¿Cómo preguntarle a Internet?

La búsqueda de información en Internet: el arte de preguntar




A continuación, realizo la experiencia de buscar información mediante la formulación de una pregunta espontánea vinculada a mi interés profesional, tal como lo haría con una persona:

Ej: ¿Son los clusters industriales un ejemplo de estrategia de desarrollo territorial?
 
Seguidamente trato de traducirla a distintos tipos de palabras clave (de campo temático, de problema específico y de referencia autoral) 
- de campo temático: desarrollo territorial geografía industrial.
- de problema específico: "desarrollo local", "cluster industrial", "aglomeraciones productivas locales".
- de referencia autoral: Fernández, Porter.
Posteriormente realicé algunos intentos de búsqueda en el Google Académico intentando con la búsqueda en títulos, reiterando la búsqueda en sucesivas oportunidades con diferentes cambios, hasta obtener un buen resultado.

El resultado final fue el siguiente: 98 resultados positivos.




martes, 16 de junio de 2015

Web superficial y web profunda

La búsqueda de información: web superficial y web profunda




¿Qué es la web superficial o visible?

Es la que se corresponde con todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.

Entre sus cualidades notables se destacan: 
  • que su información no está contenida en bases de datos,
  • que es de libre acceso,
  • que no requiere la realización de un proceso de registro para acceder a la información,
  • y que mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.




¿Qué se entiende por web profunda o invisible?

Es la palabra empleada  para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Se trata de información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.

La web profunda se divide en:

- Web opaca: compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos:
  • Extensión de la indización: a veces, por economía, no todas las páginas de un sitio son indizadas en los buscadores.
  • Frecuencia de la indización: los buscadores no poseen la capacidad de indizar todas las páginas existentes; a diario se agregan y modifican muchas y la indización no se realiza al ritmo que permita incluirlas a todas.
  • Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000).
  • URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, será imposible que la página sea encontrada, pues no se encuentra indizada.

- Web privada: consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
  • Las páginas están protegidas por contraseñas.
  • Contienen un archivo “robots.txt” para evitar ser indizadas.
  • Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página.

- Web propietaria: incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.

- Web realmente invisible: se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.


Según Lluis Codina: 
“Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.

martes, 9 de junio de 2015

¿Cómo se busca información por Internet?

Búsquedas por palabras claves y búsqueda avanzada

Crédito: comenzandodecero.com

La mejor manera de alcanzar buenos resultados en nuestras búsquedas de información en Internet es seleccionar las palabras claves correctas, ya que de ellas dependerán enteramente los resultados obtenidos.
Las herramientas de búsqueda permiten relacionar dos o más palabras claves y frases mediante operadores para ampliar la búsqueda, reducirla o reorientarla según los resultados parciales obtenidos.

Algunos de estos operadores se denominan lógicos o booleanos, en referencia al matemático y filósofo inglés, George Boole, quien en el siglo XIX ideó un sistema para el análisis de variables. Proporcionan un resultado a partir de que se cumplan o no una cierta condición. Estos operadores son Y (AND), O (OR) y NO (NOT).

  • El operador AND (Y) o el signo + delante de las palabras claves, nos indican que las páginas deberán incluir todos los términos que aparecen indicados, independientemente del orden.
  • El operador OR (O) permite obtener registros con alguno de los términos indicados. Se trata de un o excluyente, esto significa que de ambas expresiones solo una es posible. El espacio en blanco en cambio funciona como un o incluyente, ambas expresiones pueden ser posibles al mismo tiempo.
  • El operador NOT o el signo – (guión medio) delante de las palabras claves, las excluye de la búsqueda.
  • El símbolo * (asterisco): sustituye una cadena de caracteres. Un asterisco puede utilizarse en una búsqueda como marcador de posición para cualquier término comodín o desconocido. Se lo puede combinar con el uso de comillas para buscar variaciones de esa frase exacta o para recordar palabras en medio de una frase.
  • El signo ? (de interrogación): sustituye a un solo carácter en una ubicación específica.
  • Si buscamos una frase exacta o una expresión formada por varias palabras, debe encerrarse entre comillas. 
  • El símbolo @ permite buscar etiquetas sociales.
  • El símbolo # busca temas de tendencias.
  • El símbolo .. , “dos puntos sin espacios” permite obtener resultados que contengan valores incluidos en un determinado intervalo de elementos como fechas, medidas y precios.

Crédito: emezeta.com

Operadores de búsqueda especiales
Son expresiones que podemos añadir a las búsquedas para restringir los resultados Al hacer búsquedas con operadores, no se deben añadir espacios entre el operador y los términos de búsqueda.

  • El operador define: nos permite obtener la definición de una palabra.
  • El operador site: nos permite obtener resultados dentro de uno o de varios sitios o dominios.
  • El operador link: nos permite obtener páginas que apunten a un determinado sitio.
  • El operador related: nos permite encontrar sitios similares a una URL que conocemos.

La Búsqueda Avanzada

Es un tipo de búsqueda que posee características adicionales soportadas por un motor de búsqueda o buscador. Suele ser una opción de elección libre en los buscadores, programas, herramientas y servicios online.

Las búsquedas avanzadas suelen contar con múltiples cuadros de texto, casillas de verificación y otros elementos incluidos habitualmente en los formularios. Por lo general, estos elementos permiten aplicar filtros a la búsqueda básica, para obtener resultados más exactos.

La Búsqueda avanzada de Google, ofrece numerosas opciones para realizar búsquedas con mayor precisión y obtener resultados más útiles.

La Búsqueda avanzada de Google, ofrece numerosas opciones para realizar búsquedas con mayor precisión y obtener resultados más útiles. Podemos acceder a ella a través de su URL http://www.google.es/advanced_search


De lo anteriormente expuesto queda en claro que no es necesario quedarse con el primer resultado de una búsqueda de información básica, ya que es posible encontrar los datos necesarios usando las alternativas de búsqueda señaladas. Por ello se recomienda su uso y puesta en práctica para alcanzar un dominio del manejo de la información disponible en Internet.

miércoles, 3 de junio de 2015

Herramientas para la búsqueda de información

Las mejores herramientas para la búsqueda de información


Crédito: blogtrw.com

Distintos tipos de herramientas para la búsqueda de información existen en Internet. Cada una de ellas funciona de una manera diferente y tiene su propio propósito y su alcance. A continuación nos referiremos a los buscadores, metabuscadores, directorios, guías y software especializado. 

Buscadores

Crédito: dominadorweb.com
Estos motores de búsqueda utilizan tipos de software especiales que permiten localizar e indexar automáticamente, las páginas Web y además todos los documentos referenciados en ellas.

Tienen cuatro componentes básicos:
  • un robot,
  • un motor de indexación,
  • los índices, y
  • un motor de búsqueda.
El robot es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita.

El motor de indexación permite que la información de la página sea analizada y condensada, para su organización y su posterior presentación a los usuarios.

La indexación se realiza por palabras claves, que es la forma más común, o por conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras vacías”.

Pero hay otras modalidades. Así, otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten, o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags.

Para posibilitar que la búsqueda sea más sencilla, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella.

El motor de búsqueda procesa las consultas recibidas por los usuarios, para lo cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario los resultados obtenidos.

Un aspecto relevante es que este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte de todo lo que realmente hay en Internet. Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la información encontrada para su presentación.

Entre los buscadores más importantes se encuentran:

Metabuscadores

Crédito: es.wikipedia.org
Son servidores web que realizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información.

Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.

Los pasos en el funcionamiento de un metabuscador son los siguientes:

  1. El usuario realiza su petición al metabuscador.
  2. El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud.
  3. Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet.
  4. Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos.
  5. El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario.
 
El metabuscador aporta resultados seleccionados y ordenados mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas que realizamos.

Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia en un buscador no tienen por qué coincidir con las del resto.

Entre los metabuscadores más importantes se encuentran:

Crédito: juntadeandalucia.es
Estos buscadores temáticos organizan la información por medio de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de los diferentes sitios que han sido indexados.

Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de selección y categorización jerarquizada por parte de los editores.

Entre los directorios más importantes se encuentran:

Muchos buscadores incluyen además un sistema de navegación en forma de directorio y por otra parte, algunos directorios complementan sus resultados con los de una búsqueda en un buscador. Pero es importante realizar una distinción entre estos dos tipos de herramientas de búsqueda de información, ya que, se organizan y funcionan de diferente manera. 

Guías

Crédito: masaryklinea.mdl2.com
Las guías temáticas están conformadas por páginas de recursos web organizadas por áreas del dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas.

Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general. Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy cuidadosa y su actualización, frecuente.

En ciertas ocasiones, varias instituciones se asocian para la elaboración cooperativa de estas guías. Un ejemplo es la “Biblioteca Virtual WWW” (The WWW Virtual Library) http://vlib.org/ 

Software especializado

Crédito: annuaire-email.net
Puede utilizarse software especializado para mejorar las búsquedas en la Web. Se instalan en nuestra PC y operan junto a los navegadores añadiéndoles ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información.

Un ejemplo es “Copernic Agent”, una herramienta realmente útil que permite la búsqueda selectiva en múltiples fuentes y la clasificación mediante potentes herramientas de análisis.



A continuación, una síntesis de los recursos presentados (se recomienda usar las barras de desplazamientos lateral e inferior):