Kimi K2 refleja una tendencia más amplia en el sector de la IA hacia el desarrollo de código abierto para mejorar la eficiencia y lograr una adopción más amplia de productos.
La empresa emergente china Moonshot AI ha lanzado un nuevo modelo de inteligencia artificial (IA) de código abierto , llamado Kimi K2, que se promociona como excelente en conocimiento de frontera, matemáticas, codificación y tareas de agencia general, mientras la compañía busca mantener una ventaja frente a rivales como DeepSeek. De acuerdo con mynews.
Moonshot, con sede en Beijing , dijo que Kimi K2 fue desarrollado con una arquitectura de mezcla de expertos (MoE) y cuenta con un billón de parámetros totales, con 32 mil millones de los llamados parámetros activados: unidades computacionales especializadas empleadas para tareas específicas, según la publicación del blog de la empresa el viernes.
MoE es un enfoque de aprendizaje automático que divide un modelo de IA en subredes independientes, o expertos, cada uno centrado en un subconjunto de los datos de entrada, para realizar una tarea conjuntamente. Se dice que esto reduce considerablemente los costos de computación durante el preentrenamiento y logra un rendimiento más rápido durante el tiempo de inferencia.
Kimi K2 llega en dos versiones de código abierto y acceso gratuito
Moonshot afirmó haber publicado dos versiones de código abierto de Kimi K2. El modelo base, Kimi-K2-Base, se optimizó para investigadores y desarrolladores que buscan control total para el ajuste fino y soluciones personalizadas. Por el contrario, Kimi-K2-Instruct se entrenó posteriormente para experiencias de IA de uso general, chat y agente .
Kimi K2 ahora está disponible gratuitamente a través de sus aplicaciones web y móviles.
El último modelo de IA de Moonshot refleja una tendencia más amplia en la industria hacia el desarrollo de código abierto, que ha permitido a los desarrolladores (desde empresas emergentes como DeepSeek hasta empresas tecnológicas más grandes como Baidu y Alibaba Cloud ) mejorar la eficiencia y lograr una adopción más amplia de sus productos de IA.
El enfoque de código abierto brinda acceso público al código fuente de un programa, lo que permite a los desarrolladores de software externos modificar o compartir su diseño, reparar enlaces rotos o ampliar sus capacidades.