“Yo no uso sistemas de recomendación”
28-Enero-2009
Eso es lo que muchos usuarios de internet piensan cuando les hablas de la importancia que los sistemas de recomendación han ido adquiriendo en muchos de los servicios que utilizamos a diario. En ReadWriteWeb llevan unos días (realmente años, pero últimamente con más fuerza) dándole vueltas a los sistemas de recomendación en internet; en este post me voy a apoyar en algunas de sus entradas, pero iré salpicando con mis opiniones para intentar completar la idea que quiero transmitir.
En primer lugar voy a poner ejemplos de servicios, tratando de analizar en qué grado utilizan sistemas de recomendación, y empezaremos con el rey de internet: Google. El primer uso lo podemos encontrar en su famoso algoritmo para ordenar los resultados de las búsquedas: el PageRank. Este algoritmo se basa, entre otras cosas, en los enlaces que las páginas mantienen entre sí, asumiendo que, cuando la página A enlaza la página B, de alguna manera la está votando, está indicando que B es importante para A. Esto es, sin ningún lugar a dudas, una suerte de recomendación social a una escala descomunal.
Otro ejemplo de uso en Google reside en la personalización que aplica cuando un usuario realiza una búsqueda habiéndose registrado previamente en el sistema. En este caso, el orden de los resultados también tiene en cuenta el historial de navegación previo del usuario, e incluso la propia localización en la que se encuentra. Por último, está el “Quizás quiso decir:” que nos presenta cuando existe la posibilidad de habernos equivocado al escribir una palabra, ofreciendo una alternativa en función de su popularidad y la similitud con la palabra escrita.
Amazon
Si podemos hablar de un pionero en los sistemas de recomendación en internet, ese es sin duda alguna Amazon. Desde que puedo recordar, este sitio ha venido ofreciendo recomendaciones sobre otros productos que podían interesar al usuario, y poco a poco ha ido enriqueciendo la manera de hacerlo. En primer lugar, utiliza la recomendación social cuando recomienda productos por mero el hecho de que otros usuarios que ya han realizado compras similares a la tuya, también lo han adquirido. En segundo lugar, aplica la recomendación personalizada cuando tiene en cuenta tu historial de compras y de navegación en su web para ofrecerte nuevos artículos. Por último, recomienda productos relacionados con los que se visualizan durante la navegación.
Otros ejemplos
Además de Amazon y Google, cada vez existen más aplicaciones en internet que implementan servicios de recomendación, aunque en muchas ocasiones no combinan los diferentes tipos que hemos descrito, seguramente porque tampoco es siempre necesario. Por ejemplo, Strands aplica un sistema de recomendación social basado en la propia realimentación de los usuarios, asociando a cada usuario un perfil formado por las experiencias de otros usuarios y recomendando servicios y productos nuevos que están también asociados a dicho perfil. Según dice la propia web de Strands, ayudan a la gente “a descubrir cosas que no saben que les gustan”. Otros sistemas similares son SuggestRSS, para sugerir feeds, o Last.fm para sugerir música.
En AggregateKnowledge consideran que los gustos de otras personas, por muy similares que puedan parecer, apenas reflejan los tuyos, por lo que hacen un uso más intensivo de la recomendación basada en el comportamiento de los usuarios: el contenido de las páginas vistas, los clicks realizados, el tiempo pasado en cada página… Este tipo de sistemas tiende a ser más complejo que los otros, por lo que existen pocos ejemplos comerciales, aunque, eso sí, un gran número de prototipos experimentales. Aquí me daré un poco de autobombo comentando que en 2000 desarrollé, junto con otro par de personas, un servicio de recomendación de noticias llamado NotiXpress, que utilizaba un sistema de recomendación basado en el procesamiento de las noticias a las que los usuarios prestaban más atención. Al año y medio tuvimos que cerrar el servicio, pero al menos le pudimos sacar ciertos beneficios
.
Un sistema curioso e interesante es Pandora, una aplicación de recomendación de música que se basa en la similitud entre canciones. Es un proyecto grande y complejo, en el que un grupo de 50 músicos ha pasado los últimos 8 años analizando un gran número de canciones para determinar algo como la información genética de cada canción (de hecho, llaman al proyecto Genome Project). Para ello, utilizan cerca de 400 atributos que permiten describir detalles como la melodía, el ritmo, la voz, las letras, etc. A partir de una canción, teniendo en cuenta esta información, son capaces de recomendar otras canciones similares. Jinni es otro proyecto similar, aunque esta vez aplicado a películas.
El premio Netflix
Para que podamos darnos cuenta de la importancia que empiezan a tomar estos sistemas de recomendación, citaré el caso del premio Netflix. Netflix es una compañía de alquiler de DVD’s a través de la web que en 2006 lanzó un concurso para mejorar Cinematch, su motor de recomendación de películas. ¿El premio?: un millón de Euros… El concurso termina en 2011, y lo ganará el primer sistema que mejore su motor en un 10%. En la actualidad ya hay un equipo que ha alcanzado el 9.66%, pero parece que aún quedan unos meses para que alguien pueda alcanzar ese 10%.
Quizás un millón de Euros para un 10% pueda parecer demasiado, pero los propios creadores de Cinematch estiman que para poder alcanzar por sí mismos ese aumento necesitarían una inversión aún mayor, y que esa “pequeña” mejora podría traerles beneficios aún mayores.
The long tail
¿Y cuál es la ventaja que puede aportar el uso de un sistema de recomendación? ¿Es sólo un beneficio para los usuarios? ¿Es más un coste añadido que una inversión para la empresa? Yo no soy un experto en la llamada “larga cola“, pero intentaré explicar un poco el concepto para quien no lo conozca. La idea es que gracias a internet y las nuevas tecnologías se han reducido los costes de almacenamiento y distribución de los productos, haciendo innecesario focalizarse en unos pocos artículos de éxito. Esto ha permitido la aparición de un mercado en el que se producen pocas ventas de muchos productos, llegando a significar un volumen incluso mayor que el de los superventas.
Internet ha posibilitado la accesibilidad a estos productos de la larga cola, reduciendo de manera drástica los costes de marketing y difusión, y una de las herramientas que más ha ayudado en este sentido han sido los sistemas de recomendación. En el New York Times podemos encontrar un artículo de Clive Thompson en el que habla de los intentos de Netflix por mejorar su motor de recomendación, del que podemos entresacar el siguiente párrafo (traducido del inglés):
Las recomendaciones de Cinematch actualmente representan un sorprendente 60 por ciento de los alquileres de Netflix. En ocasiones incluso desvía la atención de los clientes desde los grandes éxitos hacia las películas independientes y menos comerciales. Los videoclubs tradicionales dependen de estos hits, que representan el 80% de sus alquileres. En Netflix, por el contrario, el 70% de los alquileres vienen del final de la lista (películas más antiguas o menos comerciales). Un buen sistema de recomendación, en otras palabras, no ayuda simplemente a que la gente encuentre nuevas cosas. Como Netflix ha descubierto, también les anima a consumir más productos.
Podemos decir que un buen sistema de recomendación permite dos cosas diferentes: por un lado, consigue que la gente consuma más; por otro, les descubre productos que de otra forma no conocerían. La grandeza de estos sistemas de recomendación no es que los usuarios consuman más, o lo hagan de productos de la parte baja de la cola, sino que consigue que la gente consuma más artículos en toda la cola.
Conclusión
Nuestra experiencia en sistemas de recomendación y las ventajas que éstos presentan nos han llevado a apostar desde el principio por un sistema propio que se pueda aplicar a los medios sociales, y en concreto inicialmente a Wipley. La base de nuestro motor de recomendación no la vamos a desvelar (eso es evidente
), pero estamos apostando por la utilización de tecnologías semánticas (como ya hemos comentado otras veces), ya que estamos convencidos de la aportación que pueden realizar en la mejora de los resultados.
Quizás todo esto está produciendo retrasos sobre nuestra planificación inicial, pero estoy seguro de que al final va a compensar. Además, como decía el otro día Carlos Domingo en SeedRocket (vía Carlos Blanco): “Ser el primero no te garantiza que seas el ganador, muchas veces es mejor llegar después”.
Ya somos spin-off de MAVIR
22-Enero-2009
Como podéis ver en el post que JoSeK ha publicado en el blog de Wipley, oficialmente somos una spin-off de MAVIR. Ya tenía ganas de poder dar esta noticia
.
Por cierto, muchas gracias a Víctor Peinado por su colaboración en el proceso.
La autarquía en internet
22-Enero-2009
El Ministro Miguel Sebastián pedía ayer que consumiéramos productos españoles para salvar empleos. Me vienen a la cabeza mil ideas, pero voy a tratar de ordenarlas.
Ayer escuché en alguna radio que en la UE hacer algo así es ilegal… por ese detallito acerca del libre comercio. Pero, en cualquier caso, sea o no sea legal, me imagino lo bien que les habrá sentado a los dirigentes europeos. Seguro que Angela Merkel estará muy contenta de que, por ejemplo, dejemos de comprar coches alemanes. Es posible que lo celebre incitando a los alemanes a que dejen de hacer turismo en España, y supongo que todo esto será genial para evitar el paro en nuestro país; y no me refiero sólo al turismo, sino también a los concesionarios de coches. Pero seguro que los trabajadores de los McDonalds y similares también habrán celebrado esta ocurrencia: ahora resulta que conservar sus puestos de trabajo tiene menor prioridad porque trabajan para una multinacional extranjera. ¿Y qué pasa con la energía? Nosotros no somos capaces de autoabastecernos, pero igual podemos ponernos a dar pedales muy rápido para cargar una dinamo. ¿Y las materias primas? Por ejemplo, tenemos productores nacionales de gasolina, pero el petróleo lo tenemos que importar.
Pero vamos a lo que importa en este blog. ¿Qué ocurriría si tuviéramos que autoabastecernos de servicios de internet? Por un lado, existen algunos proyectos que compiten e incluso superan a los gigantes multinacionales, generalmente aprovechando la ventaja del lenguaje (Tuenti está al nivel de Facebook; Menéame supera a Digg; Bitácoras compite con Technorati; Yes.fm está al nivel de Last.fm…), también hay plataformas que dan servicios relacionados con el mercado español sin competencia extranjera (Idealista para la búsqueda de pisos; Vueling, eDreams, MuchoViaje y mil más para viajes; Loogic para proyectos nacionales en internet; webs para los mercados de segunda mano; etc.), y hay unos cuantos proyectos que, sin competir demasiado como los “originales que vienen de fuera”, tienen su hueco y, en caso de autarquía, proporcionarían el servicio.
Pero, ¿hay en España algún buscador que pudiera suplir rápidamente a Google o Yahoo? ¿Existe un sucedáneo de Youtube o Flickr que dé ciertas garantías? ¿Cómo twittearíamos? ¿Qué servicios alternativos españoles hay para Google Reader, Maps o Docs? ¿De dónde sacarían nuestros estudiantes los textos de sus trabajos sin poder acceder a la Wikipedia?
Y en el otro extremo, ¿cuántas aplicaciones españolas cusarían perjuicios en el extranjero si sólo prestaran servicios en España? Podríamos decir que Strands o Berggi están muy bien posicionadas, pero estas empresas con base española han tenido que emigrar a Estados Unidos (como casi cualquier otra que se te ocurra).
Evidentemente, he planteado una situación extrema que nunca se va a dar, pero el análisis de todo esto me vuelve a llevar, como ocurre siempre, a la necesidad de impulsar uno de esos grandes desconocidos y olvidados en España: la INNOVACIÓN.
(Por cierto, el enlace a la entrada sobre innovación en la Wikipedia está dedicado a aquéllos que todavía no saben lo que significa :p)

Sin embargo, pese a los casos de éxito que acabo de comentar, puede haber situaciones en las que estos nuevos usos ideados por la inteligencia colectiva causen problemas al servicio, y creo que Twitter es un claro ejemplo. Si empezamos por el principio, a causa de un crecimiento tan desmesurado como seguramente imprevisto,
Ahora dejo los palos a un lado, porque todo tiene su lado bueno. Está claro que la popularidad que ha alcanzado
Lo más curioso es la cara que se le queda a tu interlocutor cuando hablas del uso de estas tecnologías: una cara de póker que nunca sé interpretar demasiado bien. No sé si lo que indica es algo así como: ¿Vosotos vais a hacer esto? ¿Un grupo de desconocido españolitos? Aunque quizás la cara quiera dar a entender que la tecnología semántica no sirve para nada; al fin y al cabo, si los de Google no la usan, será por algo…
