Texto de Google Analyzer es ahora de código abierto

Written by Cyrus on 27 mayo 2016. Posted in Noticias USB

La comprensión del lenguaje puede ser difícil de humano a humano, y mucho menos para las máquinas que intentan comprender las complejidades del lenguaje humano y el texto. Google sabe esto, así como cualquier persona que considera las innumerables consultas realizadas cada hora que toman un usuario donde tienen que ir, incluso en la cara de la estructura de la oración aberrante y faltas de ortografía desafortunadas. Hoy en día, Google es algo externalización abierto llamado SyntaxNet y, específicamente, un componente para ello, Parsey McParseface. Con una referencia al nombre entrañable encuestados Boaty McBoatface para buque de investigación de NERC anterior este año, Google es la liberación de las herramientas que utiliza para entender el lenguaje natural cuando se escribe en una caja o interpretado a través de la palabra hablada.

anchura

SyntaxNet es el marco general para analizar oraciones, llamado un “analizador sintáctico.” El Sr. McParseface es el plugin del idioma Inglés para SyntaxNet. Google afirma que el plugin puede identificar objetos, sujetos, verbos y otros bloques de construcción de las oraciones gramaticales, así como, o incluso mejor, que los lingüistas humanos capacitados.

La comprensión del lenguaje es clave para ayudar a las máquinas proporcionan adecuadamente las respuestas a un usuario estaría buscando. Por ejemplo, cuando se le preguntó acerca de “alimentos en México”, la interpretación podría ser o bien sobre la cocina mexicana, o específicamente restaurantes ubicados dentro de México. Tampoco es necesariamente incorrecto, pero las diferencias sutiles de significado en el lenguaje es lo que hace que la herramienta de Google tan poderoso.

Google ha sido abrir la fuente cada vez más con sus herramientas de aprendizaje automático. Después de abrir su plataforma de aprendizaje TensorFlow año pasado, que están liberando todo el código necesario para formar a nuevos modelos SyntaxNet en datos individuales, así como analizar el texto Inglés.