Búscalo aquí:

Aplicaciones del Ranking Lexicográfico

La idea de ranking esta presente en nuestras vidas de muchas maneras, por ejemplo, el ranking de equipos de futbol del torneo nacional, el ranking de estudiantes al final de un ciclo de estudios en la Universidad. Al escuchar la palabra "ranking" simplemente se nos viene a la mente la ordenación de elementos teniendo en cuenta algún criterio. En este post se hace una breve introducción al aprendizaje por ranking, se muestran algunas aplicaciones y algoritmos.




 De esa misma manera, en las tareas de aprendizaje supervisado como es la clasificación y la regresión, el ranking es una tarea cuyo interés es ordenar instancias. Las principales aplicaciones de aprendizaje por ranking son los sistemas de recomendación (como la implementación de Amazon), biología computacional (por ejemplo para rankear estructuras candidatas), y recuperación de información (como los buscadores Google, Yahoo, Bing y otros). Tal vez una de las aplicaciones de ranking más conocidas sea el Google pagerank, a continuación un video corto que nos dice lo que es este algoritmo que opera en la Internet.

   

 Algunos de los posibles tipos de ranking son: pointwise, pairwise y listwise. El pointwise realiza una evaluación binária y multi-valor ordinal, es un proceso considerado como intermedio entre la clasificación y la regresión, algunos algoritmos destacados son Pranking con raking, OAP-BPM, entre otros. El pairwise realiza una ordenación considerando la relevancia entre un par de instancias, los algoritmos que destacan son: LexRank, RankBoost, RankNet, entre otros. Finalmente, el listwise realiza una ordenación total o parcial de un conjunto de ejemplos, los algoritmos más destacados son: LambdaRank, AdaRank, CCA, ListNet, ListMLE, entre otros. 

Una propuesta de aprendizaje por ranking es mediante el uso de codificación de los valores de los atributos de manera tal que una ordenación lexicográfica resulte en un ranking. Esta propuesta es interesante por el hecho de que al usar un ranking lexicográfico no se necesitaria del atributo clase. 

El ranking lexicográfico tuvo sus orígenes en los árboles de decisión, más los árboles para esta aplicación necesitan de un espacio exponencial lo que les convertía en una estructura no conveniente. Surge como alternativa el algoritmo LexRank que propone la ordenación de atributos siguiendo algún criterio de separación, siendo que, la misma ordenación lexicográfica de un conjunto de datos representa exactamente la estructura de árbol. El tiempo de comparación depende de la dimensión del "string" a comparar que puede ser visto como la cantidad de atributos de una muestra, es posible la ordenación de grandes volúmenes de datos si se utilizan algoritmos de ordenación eficientes como bucket-sort o radix-sort. 

La estructura de árbol usada en el LexRank es representada en el algoritmo FlexRank por una función lineal.
Esa función lineal mejora el desempeño del algoritmo al adicionar un nuevo atributo, puesto que solo utiliza los k mejores atributos de una muestra. 

El aprendizaje por ranking es un campo de investigación abierta donde aún hay mucho que explorar, la invitación esta abierta y el campo de aplicación, como ya fue mencionado, es visible por donde vayamos. 

El artículo puede ser encontrado también en Portugués. A gente pode encontrar este post em um pequeno artigo no Português AQUI

Saludos! Quieres leer más post como éste???...suscribete aquí!!!

No hay comentarios.:

Publicar un comentario

Bienvenido a jcGeorge's Blog!!!

Por favor deja tu comentario, consulta o sugerencia, procura mantener habilitado tu perfil de Blogger o deja un enlace a tu blog o web.

Gracias por leer este blog!!!

Related Posts Plugin for WordPress, Blogger...