Modelo IA liviano que sirva pa generar codigo

GORDIO · 16 Mayo 2025

Estimeados:
Les tengo una consulta:
Leyendo el articulo de tbon (https://www.capa9.net/temas/guía-tu-propio-chatgpt-en-local.1144140/)
me pico el bichito de levantar localmente un IA en la casa, pensando en aprender a ver como se levanta el servicio y como se aprovecha mejor hacer RAG hacia carpetas de docs, conectar a DBs, autenticacion en apis y varias cosas mas q se me le ocurren.
Entonces estaba pensando en un modelo liviano pero que sea util pa generar y analizar codigo, porque entre claude, chtgpt y otras... que me dicen que llegaron al limite y espere 5 horas pa volver a usar el modelo weno, se me ocurrio levantar uno casero.

Que opinan??

unreal4u · 16 Mayo 2025

La calidad de los locales siempre va a ser inferior al lado de los comerciales y tiene que ver con que los parámetros que aceptan son muchos más ya que tienen a su disposición mega tarjetas de video con 48GB o más de VRAM.

Por el otro lado... voh dale no más! Experimentando las cosas por cuenta propia siempre te deja la mayor cantidad de conocimiento posible.

En cuanto a posibles modelos, codellama (https://www.ollama.com/library) parece ser enfocada más a código, aunque la verdad es que es mejor experimentar uno mismo, algunas veces otras más nuevas y más avanzadas funcionan mejor, es un campo que está evolucionando como enfermo de la cabeza así que todos los días cambia la cosa.

Con ollama de todas formas puedes descargar varias al mismo tiempo y experimentar con ellas. Recomendaría eso si una VGA, la con más VRAM posible (velocidad no importa taaaaaaaanto, es más importante para la calidad la cantidad de datos que puedas meter).

Saludos.

t3b4n · 16 Mayo 2025

GORDIO dijo:
Estimeados:
Les tengo una consulta:
Leyendo el articulo de tbon (https://www.capa9.net/temas/guía-tu-propio-chatgpt-en-local.1144140/)
me pico el bichito de levantar localmente un IA en la casa, pensando en aprender a ver como se levanta el servicio y como se aprovecha mejor hacer RAG hacia carpetas de docs, conectar a DBs, autenticacion en apis y varias cosas mas q se me le ocurren.
Entonces estaba pensando en un modelo liviano pero que sea util pa generar y analizar codigo, porque entre claude, chtgpt y otras... que me dicen que llegaron al limite y espere 5 horas pa volver a usar el modelo weno, se me ocurrio levantar uno casero.

Que opinan??

tbon != t3b4n

Aclarado lo anterior, queda probar no más! Dependiendo de tu hardware puedes ir probando distintos modelos disponibles. Yo al menos he tenido buenos resultados con qwen-coder y con deepseek-r1:32b (que está basado en qwen 2.5). Ahora estoy probando qwen 3, pero no he hecho nada muy complejo como para aportar. Cuando tenga nuevos datos actualizo.

ZlesM · 17 Mayo 2025

lo que te faltó mencionar es el hardware y que tanta paciencia tienes, quizá podrías cargar modelos grandes pero a 1 token por segundo no a mi no me daría da la paciencia

Carlos E. Flores · 6 Febrero 2026

Kimi

Una bestia y es Open Source

Modelo IA liviano que sirva pa generar codigo

GORDIO

Tatita del Ritmo

unreal4u

I solve problems.

t3b4n

Ocioso

ZlesM

Miembro Regular

Carlos E. Flores

Zombie