Me sigue quemando la cabeza el tema de Twitter Trends y Twitter Search. Los comentarios a mi post anterior son muy pertinentes. Twitter es el pulso del mundo. Es como si pudieramos leer todos los SMS que mandan los usuarios.
La gran pregunta es como hacer sentido de todo eso. Si yo pudiera analizar todos los tweets que hablan de jobs o de layoff, podría saber la tendencia del desempleo en tiempo real. Si pudiera ver que piensan de la última Palm, o del servicio de American Airlines, o del discurso de un candidato… todo eso tiene mucho valor. Ni hablar del valor de la informacion financiera.
No es nada fácil de implementar. Los mensajes en twitter son resumidos, y tan crípticos como un SMS, así que dudo mucho que se pueda hacer un programa que los interprete. Supongo que no debe ser difícil darse cuenta si un mensaje que contiene la palabra «job» es de alguien contento que consiguió trabajo, enojado porque lo despidieron, o habla de algo que no tiene nada que ver.
Alguien ve como desarrollar un negocio ahí?
http://www.tweetmeme.com será el Digg killer??! En vez de diggs, las historias tienen un voto por cada tweet.
Sergio, no sé cómo lo hacen, pero en Facebook están probando algo de eso:
http://www.facebook.com/lexicon/new/?topic_2=–none–&window_length=1&sentiment=&topic=obama
En el link te dice si la gente en Facebook usa la palabra «Obama» como algo positivo o negativo. Fijate que no está tan lejos con la última encuesta de popularidad del novel presidente.
Abajo del gráfico está la explicación.
Por ahora está tabulado a unas pocas palabras… supongo que cuando avancen lo liberarán a la palabra o frase que más te guste.
Creo que es más sencillo de lo que parece.
Se está avanzando mucho en los temas de web semántica, de forma que muchos actores que necesitan entender lo que escribe la gente lo están haciendo. Ayer Google me sorprendía con algo que hace unos años no pasaba.
Realicé las siguientes búsquedas:
Tecnología Emprendimientos
Emprendimientos Tecnología
Emprendimientos en Tecnología
y todos me daban resultados bastante diferentes. Hace unos años un buscador cualquiera trataba la palabra «en» como «noise word», sin embargo hoy Google la pone en contexto. Esto quiere decir que el algoritmo de Google está aprendiendo lo que realmente hace al lenguaje, que es la forma en que se usan las palabras. En definitiva: semántica.
Además hay que tener en cuenta algo muy importante. Los SMS y Tweets pueden ser dificiles de leer para una persona normal, pero en realidad son una simplificación del lenguaje. Y si simplificamos el lenguaje, mucho más facil va a ser que una computadora lo analice.
Aaahhhh!!!! ¿Se dieron cuenta lo que dije? Las computadoras no van a aprender a hablar «humano»… somos la raza inferior que va a aprender a hablar «computadora».
0x53 0x64 0x6C 0x75 0x64 0x6F 0x73 0x21
Sergio,
Hablando de tendencias y twitter, mirate este link: http://blog.blprnt.com/blog/blprnt/just-landed-processing-twitter-metacarta-hidden-data
Saludos,
sebagon
Ups, bajaron del aire el link que te pasé, pero acá podés ver el video que era lo más importante: http://vimeo.com/4587178
Vos preguntabas el otro día sobre qué aplicaciones se podían hacer sobre la información que generan los usuarios de twitter. Acá tenés una.
Se trata de un video donde muestran los viajes que hace la gente que twittea (parsean mensajes tipo «just landed in …» para obtener el destino y sacan el origen del perfil del usuario).