A través de Comscore, me entero de que las redes sociales en móviles van tomando ya cierta importancia en Europa, con 12,1 millones de usuarios sólo en Europa Occidental (Francia Alemania, Italia, España y el Reino Unido). Si nos centramos en España, me parece significativo que el 5% de los usuarios de móviles los utilicen para acceder a redes sociales, con un crecimiento anual del 114%, aunque aún estamos lejos del 9,2% de penetración y el 167% de crecimiento del Reino Unido. Además, según Allistair Hill, analista de Comscore, el uso de las redes sociales está impulsando el uso general de internet desde el móvil, dejando de ser algo únicamente para early adopters.

Eso es lo que muchos usuarios de internet piensan cuando les hablas de la importancia que los sistemas de recomendación han ido adquiriendo en muchos de los servicios que utilizamos a diario. En ReadWriteWeb llevan unos días (realmente años, pero últimamente con más fuerza) dándole vueltas a los sistemas de recomendación en internet; en este post me voy a apoyar en algunas de sus entradas, pero iré salpicando con mis opiniones para intentar completar la idea que quiero transmitir.

Google

En primer lugar voy a poner ejemplos de servicios, tratando de analizar en qué grado utilizan sistemas de recomendación, y empezaremos con el rey de internet: Google. El primer uso lo podemos encontrar en su famoso algoritmo para ordenar los resultados de las búsquedas: el PageRank. Este algoritmo se basa, entre otras cosas, en los enlaces que las páginas mantienen entre sí, asumiendo que, cuando la página A enlaza la página B, de alguna manera la está votando, está indicando que B es importante para A. Esto es, sin ningún lugar a dudas, una suerte de recomendación social a una escala descomunal.

Otro ejemplo de uso en Google reside en la personalización que aplica cuando un usuario realiza una búsqueda habiéndose registrado previamente en el sistema. En este caso, el orden de los resultados también tiene en cuenta el historial de navegación previo del usuario, e incluso la propia localización en la que se encuentra. Por último, está el “Quizás quiso decir:” que nos presenta cuando existe la posibilidad de habernos equivocado al escribir una palabra, ofreciendo una alternativa en función de su popularidad y la similitud con la palabra escrita.

Amazon

recomendacionamazonSi podemos hablar de un pionero en los sistemas de recomendación en internet, ese es sin duda alguna Amazon. Desde que puedo recordar, este sitio ha venido ofreciendo recomendaciones sobre otros productos que podían interesar al usuario, y poco a poco ha ido enriqueciendo la manera de hacerlo. En primer lugar, utiliza la recomendación social cuando recomienda productos por mero el hecho de que otros usuarios que ya han realizado compras similares a la tuya, también lo han adquirido. En segundo lugar, aplica la recomendación personalizada cuando tiene en cuenta tu historial de compras y de navegación en su web para ofrecerte nuevos artículos. Por último, recomienda productos relacionados con los que se visualizan durante la navegación.

Otros ejemplos

Además de Amazon y Google, cada vez existen más aplicaciones en internet que implementan servicios de recomendación, aunque en muchas ocasiones no combinan los diferentes tipos que hemos descrito, seguramente porque tampoco es siempre necesario. Por ejemplo, Strands aplica un sistema de recomendación social basado en la propia realimentación de los usuarios, asociando a cada usuario un perfil formado por las experiencias de otros usuarios y recomendando servicios y productos nuevos que están también asociados a dicho perfil. Según dice la propia web de Strands, ayudan a la gente “a descubrir cosas que no saben que les gustan”. Otros sistemas similares son SuggestRSS, para sugerir feeds, o Last.fm para sugerir música.

En AggregateKnowledge consideran que los gustos de otras personas, por muy similares que puedan parecer, apenas reflejan los tuyos, por lo que hacen un uso más intensivo de la recomendación basada en el comportamiento de los usuarios: el contenido de las páginas vistas, los clicks realizados, el tiempo pasado en cada página… Este tipo de sistemas tiende a ser más complejo que los otros, por lo que existen pocos ejemplos comerciales, aunque, eso sí, un gran número de prototipos experimentales. Aquí me daré un poco de autobombo comentando que en 2000 desarrollé, junto con otro par de personas, un servicio de recomendación de noticias llamado NotiXpress, que utilizaba un sistema de recomendación basado en el procesamiento de las noticias a las que los usuarios prestaban más atención. Al año y medio tuvimos que cerrar el servicio, pero al menos le pudimos sacar ciertos beneficios :) .

Un sistema curioso e interesante es Pandora, una aplicación de recomendación de música que se basa en la similitud entre canciones. Es un proyecto grande y complejo, en el que un grupo de 50 músicos ha pasado los últimos 8 años analizando un gran número de canciones para determinar algo como la información genética de cada canción (de hecho, llaman al proyecto Genome Project). Para ello, utilizan cerca de 400 atributos que permiten describir detalles como la melodía, el ritmo, la voz, las letras, etc. A partir de una canción, teniendo en cuenta esta información, son capaces de recomendar otras canciones similares. Jinni es otro proyecto similar, aunque esta vez aplicado a películas.

El premio Netflix

Para que podamos darnos cuenta de la importancia que empiezan a tomar estos sistemas de recomendación, citaré el caso del premio Netflix. Netflix es una compañía de alquiler de DVD’s a través de la web que en 2006 lanzó un concurso para mejorar Cinematch, su motor de recomendación de películas. ¿El premio?: un millón de Euros… El concurso termina en 2011, y lo ganará el primer sistema que mejore su motor en un 10%. En la actualidad ya hay un equipo que ha alcanzado el 9.66%, pero parece que aún quedan unos meses para que alguien pueda alcanzar ese 10%.

Quizás un millón de Euros para un 10% pueda parecer demasiado, pero los propios creadores de Cinematch estiman que para poder alcanzar por sí mismos ese aumento necesitarían una inversión aún mayor, y que esa “pequeña” mejora podría traerles beneficios aún mayores.

The long tail

¿Y cuál es la ventaja que puede aportar el uso de un sistema de recomendación? ¿Es sólo un beneficio para los usuarios? ¿Es más un coste añadido que una inversión para la empresa? Yo no soy un experto en la llamada “larga cola“, pero intentaré explicar un poco el concepto para quien no lo conozca. La idea es que gracias a internet y las nuevas tecnologías se han reducido los costes de almacenamiento y distribución de los productos, haciendo innecesario focalizarse en unos pocos artículos de éxito. Esto ha permitido la aparición de un mercado en el que se producen pocas ventas de muchos productos, llegando a significar un volumen incluso mayor que el de los superventas.

Internet ha posibilitado la accesibilidad a estos productos de la larga cola, reduciendo de manera drástica los costes de marketing y difusión, y una de las herramientas que más ha ayudado en este sentido han sido los sistemas de recomendación. En el New York Times podemos encontrar un artículo de Clive Thompson en el que habla de los intentos de Netflix por mejorar su motor de recomendación, del que podemos entresacar el siguiente párrafo (traducido del inglés):

Las recomendaciones de Cinematch actualmente representan un sorprendente 60 por ciento de los alquileres de Netflix. En ocasiones incluso desvía la atención de los clientes desde los grandes éxitos hacia las películas independientes y menos comerciales. Los videoclubs tradicionales dependen de estos hits, que representan el 80% de sus alquileres. En Netflix, por el contrario, el 70% de los alquileres vienen del final de la lista (películas más antiguas o menos comerciales). Un buen sistema de recomendación, en otras palabras, no ayuda simplemente a que la gente encuentre nuevas cosas. Como Netflix ha descubierto, también les anima a consumir más productos.

Podemos decir que un buen sistema de recomendación permite dos cosas diferentes: por un lado, consigue que la gente consuma más; por otro, les descubre productos que de otra forma no conocerían. La grandeza de estos sistemas de recomendación no es que los usuarios consuman más, o lo hagan de productos de la parte baja de la cola, sino que consigue que la gente consuma más artículos en toda la cola.

Conclusión

Nuestra experiencia en sistemas de recomendación y las ventajas que éstos presentan nos han llevado a apostar desde el principio por un sistema propio que se pueda aplicar a los medios sociales, y en concreto inicialmente a Wipley. La base de nuestro motor de recomendación no la vamos a desvelar (eso es evidente :) ), pero estamos apostando por la utilización de tecnologías semánticas (como ya hemos comentado otras veces), ya que estamos convencidos de la aportación que pueden realizar en la mejora de los resultados.

Quizás todo esto está produciendo retrasos sobre nuestra planificación inicial, pero estoy seguro de que al final va a compensar. Además, como decía el otro día Carlos Domingo en SeedRocket (vía Carlos Blanco): “Ser el primero no te garantiza que seas el ganador, muchas veces es mejor llegar después”.

Como podéis ver en el post que JoSeK ha publicado en el blog de Wipley, oficialmente somos una spin-off de MAVIR. Ya tenía ganas de poder dar esta noticia :) .

Por cierto, muchas gracias a Víctor Peinado por su colaboración en el proceso.

El Ministro Miguel Sebastián pedía ayer que consumiéramos productos españoles para salvar empleos. Me vienen a la cabeza mil ideas, pero voy a tratar de ordenarlas.

Ayer escuché en alguna radio que en la UE hacer algo así es ilegal… por ese detallito acerca del libre comercio. Pero, en cualquier caso, sea o no sea legal, me imagino lo bien que les habrá sentado a los dirigentes europeos. Seguro que Angela Merkel estará muy contenta de que, por ejemplo, dejemos de comprar coches alemanes. Es posible que lo celebre incitando a los alemanes a que dejen de hacer turismo en España, y supongo que todo esto será genial para evitar el paro en nuestro país; y no me refiero sólo al turismo, sino también a los concesionarios de coches. Pero seguro que los trabajadores de los McDonalds y similares también habrán celebrado esta ocurrencia: ahora resulta que conservar sus puestos de trabajo tiene menor prioridad porque trabajan para una multinacional extranjera. ¿Y qué pasa con la energía? Nosotros no somos capaces de autoabastecernos, pero igual podemos ponernos a dar pedales muy rápido para cargar una dinamo. ¿Y las materias primas? Por ejemplo, tenemos productores nacionales de gasolina, pero el petróleo lo tenemos que importar.

Pero vamos a lo que importa en este blog. ¿Qué ocurriría si tuviéramos que autoabastecernos de servicios de internet? Por un lado, existen algunos proyectos que compiten e incluso superan a los gigantes multinacionales, generalmente aprovechando la ventaja del lenguaje (Tuenti está al nivel de Facebook; Menéame supera a Digg; Bitácoras compite con Technorati; Yes.fm está al nivel de Last.fm…), también hay plataformas que dan servicios relacionados con el mercado español sin competencia extranjera (Idealista para la búsqueda de pisos; Vueling, eDreams, MuchoViaje y mil más para viajes; Loogic para proyectos nacionales en internet; webs para los mercados de segunda mano; etc.), y hay unos cuantos proyectos que, sin competir demasiado como los “originales que vienen de fuera”, tienen su hueco y, en caso de autarquía, proporcionarían el servicio.

Pero, ¿hay en España algún buscador que pudiera suplir rápidamente a Google o Yahoo? ¿Existe un sucedáneo de Youtube o Flickr que dé ciertas garantías? ¿Cómo twittearíamos? ¿Qué servicios alternativos españoles hay para Google Reader, Maps o Docs? ¿De dónde sacarían nuestros estudiantes los textos de sus trabajos sin poder acceder a la Wikipedia?

Y en el otro extremo, ¿cuántas aplicaciones españolas cusarían perjuicios en el extranjero si sólo prestaran servicios en España? Podríamos decir que Strands o Berggi están muy bien posicionadas, pero estas empresas con base española han tenido que emigrar a Estados Unidos (como casi cualquier otra que se te ocurra).

Evidentemente, he planteado una situación extrema que nunca se va a dar, pero el análisis de todo esto me vuelve a llevar, como ocurre siempre, a la necesidad de impulsar uno de esos grandes desconocidos y olvidados en España: la INNOVACIÓN.

(Por cierto, el enlace a la entrada sobre innovación en la Wikipedia está dedicado a aquéllos que todavía no saben lo que significa :p)

Creo que lanzar un proyecto para internet es una de las cosas menos predecibles que hay. Podríamos poner numerosos ejemplos de proyectos con un gran soporte económico y de recursos humanos que no han tenido éxito, como también podríamos citar proyectos que, sin ese soporte inicial, han llegado a dominar su mercado de forma indiscutible (esos proyectos de garaje…).

Todo esto hace de internet un espacio de oportunidades donde el que manda es el usuario. Si el usuario acepta tu servicio, todo va bien; si no le interesa, ya te puedes gastar una millonada, que eso no hay forma de levantarlo… Pero lo que a mí más me ha llamado siempre la atención es la inteligencia colectiva que orienta los servicios de una u otra manera: lo que ayer comenzó como una aplicación para poner en contacto a estudiantes universitarios, hoy se ha convertido en el referente mundial para hacer y mantener contactos; lo que empezó como un sitio para colgar tus videos, actualmente se está utilizando como buscador de la misma manera que se emplean Google o Yahoo!.

twitterdownSin embargo, pese a los casos de éxito que acabo de comentar, puede haber situaciones en las que estos nuevos usos ideados por la inteligencia colectiva causen problemas al servicio, y creo que Twitter es un claro ejemplo. Si empezamos por el principio, a causa de un crecimiento tan desmesurado como seguramente imprevisto, Twitter ha sufrido problemas de dimensionamiento y, durante una gran parte de 2008, pasaba casi más tiempo caído que dando servicio (bueno, quizás es una exageración, pero todos nos entendemos). En segundo lugar, el modelo de servicios que ofrece Twitter ha posibilitado la creación de un gran número de aplicaciones externas que utilizan su API, aumentando de forma importante el tráfico del servicio sin aportarles un beneficio directo. Y no me refiero directamente a un beneficio económico como podría ser el pago por utilizar su sistema (ya hemos comentado otras veces lo de su no-modelo de negocio), sino al simple hecho de que estos accesos produzcan impresiones de páginas que Twitter pueda aprovechar de alguna manera (como, por ejemplo, ocurre con Facebook). De hecho, alguno ya considera que Twitter no es una empresa o una plataforma, sino un protocolo.

twitter_helpAhora dejo los palos a un lado, porque todo tiene su lado bueno. Está claro que la popularidad que ha alcanzado Twitter entre los usuarios “hardcore” de internet es bastante alta y, según el medio que consultes, el crecimiento en 2008 ha estado entre un 350% y un 750%. Teniendo en cuenta esta posición dominante en la que se encuentran, seguro que su nuevo Director de Desarrollo de Negocio será capaz de aprovecharlo de alguna manera, pero si no lo es, ya hay gente por ahí lanzando ideas para su modelo de negocio.

En resumen, creo que el estdo actual de Twitter requiere un manejo cuidadoso, ya que su buena disposición al diseñar un sistema tan abierto les ha hecho caer en una trampa: no va a ser fácil redirigir el tráfico a su web (mucha gente utiliza aplicaciones externas tanto desde PC’s como desde móviles), como tampoco será fácil sacar provecho del tráfico externo. Sé que era prácticamente imposible que los creadores de Twitter hubieran podido adivinar adónde les llevaría esta estrategia, pero creo que todos debemos aprender de situaciones como ésta. Eso sí, siendo sincero, creo que no me importaría llegar a tener problemas como esos; no sería una mala señal… :)

Ya llevo algún tiempo trabajando con tecnologías semánticas aplicadas a la búsqueda de información, y mi interés en la materia ha quedado patente en algunos post que escribí el verano pasado. En Wipley también hemos tenido claro desde el principio el papel que pueden jugar las tecnologías semánticas dentro de nuestro sistema, y hemos procurado que en nuestras presentaciones quede constancia de que esto va a ser así, aunque no proporcionemos detalles que se suelen escapar de los foros en que nos hemos estado moviendo.

screamLo más curioso es la cara que se le queda a tu interlocutor cuando hablas del uso de estas tecnologías: una cara de póker que nunca sé interpretar demasiado bien. No sé si lo que indica es algo así como: ¿Vosotos vais a hacer esto? ¿Un grupo de desconocido españolitos? Aunque quizás la cara quiera dar a entender que la tecnología semántica no sirve para nada; al fin y al cabo, si los de Google no la usan, será por algo…

Para los que estén en el primer grupo, les puedo contestar con datos a partir de nuestros experimentos y proyectos de investigación. A los que se encuentren en el segundo, no les voy a contestar yo; lo va a hacer el Dr. Rudi Studer, profesor en la Universidad de Karlsruhe y, entre otras cosas, director del Karlsruhe Service Research Institute y ex-presidente de la Semantic Web Science Association (un mindundi, vaya…). Entre toda la maraña de posts atrasados he encontrado una entrevista que le realizaban para el blog de Yahoo el pasado 16 de diciembre, en la que le preguntaban por las tecnologías de búsqueda semántica. Como la entrevista en general puede resultar un poco pesada para la mayoría, voy a entresacar una de las preguntas y su contestación:

Yahoo!: ¿Qué oportunidades comerciales piensa Vd. que aún quedan por explorar en el campo de las tecnologías semánticas?

Dr. Studer: Hasta el momento, las las tecnologías semánticas se han utilizado en productos comerciales para la integración de datos, búsqueda semántica y gestión de contenidos para empresas, etc. Espero que este área crezca, pero potencialmente veo mayores oportunidades de negocio en la combinación de la web social y las tecnologías semánticas, así como en el contexto de los mashups. Un área que en la que está casi todo por explorar es el área de la publicidad en el contexto de la búsqueda semántica.

No pretendo decir algo así como “nosotros lo dijimos antes”, entre otras cosas porque no es verdad, pero sí pretendo que la próxima vez que oigas hablar de este tipo de cosas (a nosotros o a otros), no dejes de prestar atención de forma inmediata y te tomes en serio al que tienes delante. Como ocurre siempre, dentro de unos años todo el mundo dirá “ya decía yo que el futuro estaba en las tecnologías semánticas”. El momento de subirse a la ola es ahora, no cuando ya haya roto y esté en la orilla.

Editado: Lo que son las cosas, unos minutos después de publicar este post leo en ReadWriteWeb que Google puede estar utilizando ya tecnologías semánticas en el buscador. A lo mejor, si los de Google la empiezan a usar, será por algo… ;-)