El futuro de la IA generativa en las empresas podría basarse en modelos de lenguaje más pequeños y enfocados


Las asombrosas habilidades de ChatGPT de OpenAI no sería posible sin grandes modelos de lenguaje. Estos modelos se entrenan en miles de millones, a veces billones de ejemplos de texto. La idea detrás de ChatGPT es entender el lenguaje tan bien que puedas anticipar qué palabra vendrá a continuación en una fracción de segundo. Esto requiere mucha capacitación, recursos informáticos y experiencia en desarrollo para que esto suceda.

Pero quizás el futuro de estos modelos esté más enfocado que el enfoque candente que hemos visto de OpenAI y otros, que quieren poder responder todas las preguntas bajo el sol. ¿Qué pasaría si cada industria o incluso cada empresa tuviera su propio modelo capacitado para comprender la jerga, el lenguaje y el enfoque de la entidad única? Quizás entonces obtendremos menos respuestas completamente inventadas porque las respuestas provendrán de un universo más limitado de palabras y frases.

En un futuro impulsado por la IA, los datos de cada empresa pueden ser su activo más valioso. Si es una compañía de seguros, tiene un léxico completamente diferente al de un hospital, una compañía automotriz o una firma de abogados, y cuando combina eso con los datos de sus clientes y el grupo de contenido de la organización, tiene un modelo de lenguaje. Si bien tal vez no sea grande, como en el sentido de un modelo de lenguaje realmente grande, ese sería justo el modelo que necesita, un modelo hecho para uno y no para las masas.

Esto también requerirá un conjunto de herramientas para recopilar, agregar y actualizar constantemente el conjunto de datos de la empresa de una manera que lo haga inmanejable para estos modelos de lenguaje pequeño a grande (sLLM).

Construir estos modelos podría ser un desafío. Es probable que recurran a algo como el código abierto o los LLM existentes de una empresa privada y luego los refinen en datos de la industria o de la empresa para enfocarlos más, todo en un entorno más seguro que la variedad LLM genérica.

Esto presenta una gran oportunidad para la comunidad de startups, y estamos viendo muchas empresas con una ventaja inicial en esta idea.