Tres formas de identificar las aplicaciones de PNL dentro de una empresa
El procesamiento del lenguaje natural (NLP) es una poderosa herramienta que puede ayudar a las empresas a obtener valor de grandes volúmenes de texto. NLP es la rama del aprendizaje automático (ML) que se enfoca en entrenar computadoras para comprender el lenguaje escrito, una habilidad que es natural para los humanos e históricamente ha sido muy difícil para las máquinas. Muchas empresas tienen el lenguaje natural en el centro de sus flujos de trabajo. Ya sea leyendo artículos de noticias, solicitando documentos legales, buscando patrones en transcripciones de llamadas o comprendiendo informes escritos, la mayoría de las empresas pasan mucho tiempo trabajando con texto. En este artículo, analizaremos formas de identificar cuándo se puede utilizar NLP para hacer que estos flujos de trabajo de lenguaje natural sean más rápidos y eficientes.
Escaleras
La escala es el primer punto a considerar al determinar las aplicaciones de NLP dentro de su empresa. Si un empleado individual pasa una hora al día clasificando documentos en categorías, un modelo ML podría ayudarlo a hacer este trabajo más rápidamente, pero el costo de comprar o construir y mantener un modelo para un caso de negocios tan pequeño supera con creces el costo. beneficio.
Las soluciones de ML ofrecen el mayor valor cuando se ejecutan a escala. Si cientos de empleados pasan horas al día clasificando documentos, entonces la escala es lo suficientemente grande como para considerar un modelo NLP. NLP se utiliza para ayudar a los analistas a comprender las tendencias en escenarios de datos de gran volumen y alta velocidad, como flujos de noticias, registros de seguridad cibernética y fuentes de redes sociales. Estos son casos en los que la escala del texto en lenguaje natural es tan grande que requeriría una gran cantidad de horas-persona para procesar. Los modelos NLP pueden hacer que la gestión de estos datos sea manejable y rentable.
tipo de problema
La PNL es más adecuada para resolver problemas discretos. Un problema discreto tiene una entrada clara y una salida clara, así como una «respuesta correcta» definida. A menudo, los flujos de trabajo que involucran lenguaje natural deben dividirse en varias tareas distintas para que se aplique la PNL.
Por ejemplo, considere la tarea de comprender las señales de mercado de las noticias. Un ser humano que trabaje en esta tarea probablemente realizará muchas tareas secundarias más pequeñas, a menudo sin pensar en ellas como problemas discretos, como encontrar artículos relevantes, identificar empresas en cada artículo, extraer métricas financieras y rastrear tendencias. Si bien un solo modelo no puede automatizar todo el proceso, podemos usar el aprendizaje automático en cada etapa: un clasificador de texto puede identificar elementos en los mercados financieros, un modelo de reconocimiento de entidades con nombre puede seleccionar empresas y números, y un modelo de regresión lineal puede encontrar patrones en los datos a lo largo del tiempo. Al desglosar los flujos de trabajo complejos en sus actividades discretas, podemos aplicar la PNL en los lugares donde puede ofrecer el mayor valor.
Precisión
La precisión es el tercer y último punto a considerar para determinar si la PNL es adecuada para su negocio. Si bien los avances modernos en la investigación del aprendizaje automático han llevado a modelos que, en ocasiones, pueden igualar el desempeño humano en tareas específicas, incluso las mejores soluciones de PNL en la industria tienen fallas y deben usarse con cuidado.
Las predicciones que ofrecen los modelos ML son probabilísticas: si bien un modelo puede confiar en su respuesta, siempre existe la posibilidad de que se equivoque. Esto significa que las soluciones de PNL deben usarse en situaciones donde la precisión imperfecta es aceptable.
Por ejemplo, si su modelo se usa para predecir el sentimiento de las publicaciones en las redes sociales sobre su empresa, es probable que haga miles de predicciones al día; si alguna de estas predicciones es incorrecta, estos errores tendrán poco impacto en el resultado agregado. Sin embargo, si está utilizando un modelo GNP para evaluar los ensayos de ingreso a la universidad, una sola predicción incorrecta del modelo podría tener un gran impacto negativo en un individuo. Al usar cualquier solución de aprendizaje automático, debemos esperar errores y trabajar para mitigar su impacto.
El procesamiento del lenguaje natural es una poderosa herramienta que se puede utilizar para mejorar la eficiencia de muchos procesos comerciales que involucran texto. La PNL puede simplificar tareas, aumentar la productividad y reducir costos. Además, estos modelos pueden encontrar patrones en conjuntos de datos de gran volumen y alto rendimiento que, de otro modo, serían muy difíciles de entender, lo que permite la toma de decisiones basada en datos. Al intentar aprovechar el poder de la PNL, es importante considerar el alcance del problema, si el problema se puede dividir en subtareas discretas y requisitos de precisión. Cuando se aplica al problema correcto, la PNL puede ofrecer un valor increíble al agregar eficiencia, ahorrar tiempo y dinero y desbloquear nuevos conocimientos.
Sobre el Autor

Domenic Puzio es ingeniero sénior de aprendizaje automático en el equipo de NLP de Kensho Technologies con más de siete años de experiencia en aprendizaje automático. Es líder técnico de Kensho NERD, una herramienta que reconoce entidades importantes en texto no estructurado y las vincula a perfiles en varias bases de datos. Domenic estudió Matemáticas y Ciencias de la Computación en la Universidad de Virginia y tiene una Maestría en Ciencias de la Computación con énfasis en Aprendizaje Automático de Georgia Tech. Ha pasado su carrera construyendo y produciendo modelos de aprendizaje automático para ciberseguridad, seguridad nacional y finanzas. Domenic actualmente está explorando las aplicaciones de modelos de lenguaje extenso para varios problemas de PNL.
Regístrese para recibir el boletín gratuito insideBIGDATA.
Únase a nosotros en Twitter: https://twitter.com/InsideBigData1
Únase a nosotros en LinkedIn: https://www.linkedin.com/company/insidebigdata/
Únase a nosotros en Facebook: https://www.facebook.com/insideBIGDATANOW