Conferencia de Directores y Decanos de Ingeniería Informática

Mensajes etiquetados Premio nacional de informática

Entrevista a Ricardo Baeza-Yates, Premio Nacional de Informática

Ricardo Baeza-Yanes, premio nacional de Informática (El País)

La sabiduría de las masas es falsa porque la gente activa en la Red es una minoría, según explica el experto.

Todo lo que hay en Internet es obra de unos pocos. Unos «pocos» que son decenas de millones de personas, pero que solo representan un porcentaje pequeño del total de usuarios. La web es un océano infinito que cubre toda la Tierra, pero la gente que la alimenta cabría en una isla.

Menos del 1% de usuarios de Internet crea más del 50% del contenido. «Si tomas cualquier segmento de tiempo determinado, el porcentaje de gente activa en Internet seguro que es menos del 10%», explica el profesor chileno Ricardo Baeza-Yates. «Lo he visto en lugares donde he trabajado. La mayor parte de gente en internet, en las redes sociales sobre todo, está de mirón, sin hacer nada. Ni siquiera hace un like. No genera datos para internet, que no es lo mismo que estar activo. La gente que contribuye, que hace un like, podría ser un 10%, pero quienes hacen un tuit o un post o cuelgan una foto, van a ser menos», añade.

En distintos trabajos, Baeza-Yates ha encontrado que un 4% de los usuarios activos escribe las reseñas en Amazon («y eso que un mes después de publicar el artículo Amazon empezó a perseguir las reseñas pagadas, con lo que el número real es menor»), un 2% de usuarios escribe la mitad de tuits en Twitter y que la primera versión de la mitad de entradas de la Wikipedia en inglés fue creada por un 0,04% de sus usuarios registrados, unas 2.000 personas. «Y fue porque les pagaron, porque quién participa en algo que está vacío», dice Baeza-Yates.

En internet también funciona una ley humana que la sabiduría popular española conoce bien: uno hace, muchos miran. «Es el sesgo de actividad: pocos trabajan y muchos no hacen nada. En cualquier actividad humana, se ve este sesgo. Pocos tiran, los otros siguen», explica Baeza. Es un fenómeno tan establecido que tiene un nombre: la ley de Zipf.

«La consecuencia más importante de este fenómeno es que la sabiduría de masas es una ilusión», dice Baeza-Yates en una conversación con EL PAÍS en Madrid, donde acudió para participar en la inauguración de la sede de la factoría de inteligencia artificial del BBVA. Baeza-Yates es también premio Nacional de Informática en investigación industrial y transferencia tecnológica 2018, director de programas de posgrado en ciencia de datos en el campus de Silicon Valley de la Northeastern University, catedrático de la Universitat Pompeu Fabra y jefe de tecnología de NTENT, una compañía de búsquedas en Silicon Valley, donde vive.

La sabia masa de internet no es por tanto todos los humanos que usan la red, sino quienes generan contenido. «Es la sabiduría de la gente que está haciendo cosas. Si hay grupos que quieren manipular en Twitter en Estados Unidos, en Facebook en Filipinas o WhatsApp en Brasil tienen mucha potencia porque hay muchos que no hacen nada, que solo miran», explica.

Baeza-Yates cree que un rasgo a menudo común de los usuarios más activos es que son «los malos», como en los casos de Filipinas, Brasil o Estados Unidos. «La gente que quiere manipular es más activa que la que no quiere manipular», dice, «por una razón sencilla: la gente que quiere manipular tiene un objetivo y por tanto una motivación para actuar, mientras que la mayoría de la gente no tiene ni siquiera la motivación para participar». Las ganas de fastidiar son un incentivo maravilloso en un mundo donde la mayoría solo se asoma.

Estos hallazgos forman parte de una larga investigación de Baeza-Yates sobre los sesgos en la web. Como el ya canal principal de comunicación humana, los sesgos que produce internet están destinados a marcar muchas de nuestras decisiones futuras. Los pocos usuarios activos son un sesgo habitual que tenemos cuando creemos que lo que leemos en Twitter es lo que «cree la gente». Es el sesgo de actividad. Pero hay más.

La profundidad de internet

¿Qué hay en el fondo de internet? La sensación real de que en internet está todo no sirve para las cosas que no sabemos que existen. ¿Cómo sabe Netflix que una película no gusta si ni siquiera la ha enseñado a un grupo suficiente de usuarios para que decidan si quieren verla? Algo parecido pasa con los resultados de las búsquedas, más ahora cuando Google intenta que los usuarios no abandonen su página para ver lo que buscan. ¿Quién se molesta en ir a mirar el resultado 35 de una búsqueda? Una página puede subir en los resultados gracias a enlaces y otros criterios, pero la competición es cada vez mayor.

«Este sesgo de presentación o exposición es el más grave. Es imposible enseñar todo a todo el mundo para que decida», dice Baeza-Yates. Y tampoco es trivial calcularlo: ¿a quién se enseña lo que nadie ve? Por ejemplo, una película polaca en Netflix. Si se le muestra aleatoriamente a un 5% de los usuarios norteamericanos, ¿son esos representativos para luego enseñarla a más? «¿Y por qué en ese caso solo un 5%?», se pregunta Baeza-Yates. «Porque pierdo dinero», responde. Si Facebook se arriesga a enseñar más de un 5% de los posts que nadie presuntamente quiere ver, se arriesga a que los usuarios tengan menos interés y acaben viendo menos anuncios en los que clicar.

La larga cola de internet, donde cada cual tenía lo que quería porque colgar un libro o una película era casi gratis, se ha convertido en el «desierto digital». «La web se ha hecho casi infinita y ha crecido mucho más rápido que el número de personas conectadas a Internet», dice Baeza-Yates. En un artículo de 2015, intentó encontrar umbrales aproximados de ese desierto. Un 1,1% de los tuits son escritos por gente sin seguidores, decía Baeza-Yates, y un 31% de los artículos de la Wikipedia modificados en mayo de 2014 nunca fueron visitados en junio. «El tamaño de ese desierto digital probablemente esté en la parte baja de esa franja 1%-31%», dice Baeza-Yates. Y creciente.

Autor: Jordi Pérez Colomé

Fuente: EL PAÍS

«La tecnología avanza muy rápido y las leyes muy lentas»

La tesis del vigués David Vilares, reconocido como el mejor investigador joven en los premios nacionales de Informática, intenta capturar datos de las emociones de la gente cuando opina en foros

En el grupo de investigación de David Vilares (Vigo, 1989) se trabaja en técnicas que sepan capaces de comprender el lenguaje humano en general. «Parte de mi tesis se centra en desarrollar técnicas que sean capaces de extraer las emociones y opiniones que emitimos cuando nos estamos comunicando», detalla.

-¿Puede poner un ejemplo?

-TripAdvisor, por ejemplo. La capacidad de poder analizar de manera rápida qué piensan los usuarios sobre determinados aspectos de un hotel o un restaurante que están evaluando. O, por ejemplo, en el caso que quieras comprar un coche indicas unas claves: que consuma poco, que sea respetuoso con el medio ambiente y que se pueda usar en zonas rurales. Pues con un rastreo en webs donde opinan los usuarios el algoritmo podría darte un resumen personalizado sobre los puntos que a ti te interesan.

-Muchos desconfían de estos avances. Las personas cada vez están más controladas por ese rastro en Internet.

-No hay que ser sensacionalista ni catastrofista. La tecnología está para ayudar a las personas, aunque luego se pueda retorcer usándola con un mal propósito. Ahí entra en juego la regulación. Muchas veces la tecnología avanza muy rápido y las leyes van muy lentas. Lo ideal sería que fueran los dos a la par.

-¿En qué trabaja ahora?

-En desarrollar técnicas que detecten la estructura sintáctica de las oraciones. Para que un ordenador pueda hacer eso de una manera muy rápida y luego poder hacer búsquedas más precisas. Lo que se busca es tener la comprensión de un humano y para eso necesitas tener la estructura de la oración, no solo un listado de palabras.

-¿Se podría hacer un diálogo con una máquina de manera fluida?

-Existen asistentes con los que puedes hacer algunas cosas, pero no hacer una conversación como la que estamos teniendo ahora. Eso tardará.

-¿Mucho?

-Sí, el lenguaje humano es muy complejo. ¿Cómo tratas la ironía, el sarcasmo o todo el conocimiento que está detrás de las palabras? Para llegar a sistemas realmente efectivos tardaremos. Hay mucho trabajo que desarrollar.

-¿Qué supone para usted el premio?

-A nivel personal, la alegría de sentirte reconocido. También para la familia, que me gusta que lo vean.

Fuente: La Voz de Galicia

«En estos momentos en Informática el paro es igual a cero»

El trabajo que se desarrolla en la Facultad de Informática de la UDC ha tenido su reconocimiento esta semana. Por un lado, el catedrático Ramón Doallo ha sido galardonado con el Premio Nacional de Informática 2018. Por otro, David Vilares Calvo ha sido reconocido como el mejor joven investigador de este año.

Artículo de Javier Becerra

Su trabajo dentro del campo de la arquitectura de computadores le ha valido a Ramón Doallo (Ourense, 1964) el reconocimiento nacional. «Es la parte de la informática que se encarga de diseñar un computador. Mi especialidad ahí es la computación de altas prestaciones o supercomputación. Está encaminada a conseguir prestaciones que trabajen lo más rápido posible», explica.

-¿En qué ámbito se pueden aplicar esos avances?

-Hay simuladores de ingeniería en los que operaciones que pueden llevar semanas de cálculo con los supercomputadores se hace en mucho menos tiempo. Pero no solo eso, muchas de las cosas que desarrollamos tienen incidencia en la gente normal. De hecho, están incorporadas en los portátiles y los móviles.

-¿Y eso tiene un reflejo a nivel empresarial?

-Sí, siempre hemos procurado que todo nuestro trabajo tenga un trasvase real al sector productivo. Hemos hecho muchas colaboraciones con la administración pública, en sistemas de información geográfica. También en el sector TIC con firmas como Hewlett Packard o Fujitsu. Yo además soy socio promotor de una startup.

-Habla de firmas internacionales. ¿Se derriban las barreras o es que directamente ya no existen para hacer tecnología de primer nivel en Galicia?

-Por supuesto. El ámbito informático, además de posibilitar el trabajar en remoto, permite que puedas acceder a fuentes de información en todo el mundo. Tenemos los mismos medios que un laboratorio de EE.UU o de China. El talento está en todas partes. No hay diferencias entre unos sitios y otros. Lo que nos puede diferenciar es que estamos dando una buena formación a nuestros estudiantes. Y eso se demuestra en que tienen trabajo en muy poco tiempo. No tienen ningún problema para trabajar en el extranjero. Tienen más, y es una pena, en España.

-No es una de las facultades que más paro tenga.

-No. En estos momentos en Informática el paro es igual a cero. De hecho, ya muchos alumnos ya antes de terminar ya están con algún contrato a tiempo parcial. Están las empresas continuamente buscando personal informático.

-¿En qué trabajan para el futuro desde su departamento?

-Por ejemplo, la computación en la nube. Y converger la computación de altas prestaciones con la inteligencia artificial.

Fuente: La Voz de Galicia