O campo da inteligência artificial acaba de dar as boas-vindas a um novo modelo de linguagem de inteligência artificial (IA) na forma de NeuralBeagle14-7B. Este modelo avançado de IA está agitando com seus 7 bilhões de parâmetros e rapidamente subiu na classificação para se tornar um concorrente líder entre os grandes modelos de linguagem.
NeuralBeagle não é um modelo como qualquer outro; é um híbrido, criado combinando as melhores características de dois modelos existentes, Beagle e Mar Coro. Essa fusão foi aprimorada ainda mais por uma técnica exclusiva chamada Lazy Merge Kit. NeuralBeagle14-7B é um ajuste DPO de mlabonne/Beagle14-7B usando o conjunto de dados de preferência argilla/distilabel-intel-orca-dpo-pairs.
Mergekit é um kit de ferramentas para mesclar modelos de linguagem pré-treinados. O Mergekit usa uma abordagem externa para realizar fusões excessivamente elaboradas em situações com recursos limitados. As mesclagens podem ser executadas inteiramente na CPU ou aceleradas com apenas 8 GB de VRAM. Muitos algoritmos de fusão são suportados e outros estão em desenvolvimento.
O sucesso do NeuralBeagle baseia-se no alto desempenho do modelo Beagle, que já havia demonstrado suas capacidades ao alcançar bons resultados em um conhecido ranking de IA. Ao integrar o Beagle ao Mar Coro, os desenvolvedores criaram um modelo poderoso que aproveita os pontos fortes de ambos. Mas a equipe não parou por aí. Também aplicou um processo de refinamento conhecido como “Opção Preferencial de Domínio” (DPO). Embora este ajuste fino não tenha melhorado radicalmente o desempenho do modelo, forneceu informações importantes sobre o processo de ajuste fino e os seus efeitos nos modelos de IA.
NeuralBeagle14-7B
NeuralBeagle se destaca pela versatilidade. Foi rigorosamente testado em diversas plataformas, incluindo AGI Evol e GPT-4-All, demonstrando sua capacidade de realizar uma ampla gama de tarefas. Essa adaptabilidade demonstra o design sofisticado do modelo e suas possibilidades de utilização em diversas aplicações. NeuralBeagle14-7B usa pop-up de 8k. É compatível com diferentes modelos, como chatml e modelo de chat Llama. NeuralBeagle14-7B está classificado em primeiro lugar no Open LLM Leaderboard na categoria ~7B.
Para os interessados em ver o NeuralBeagle em ação, o modelo está disponível para experimentar no Hugging Face Spaces. Esta plataforma interativa permite que os usuários interajam diretamente com o NeuralBeagle e vejam como ele funciona. E para quem deseja integrar o NeuralBeagle em seus próprios projetos, há instruções detalhadas de instalação do LM Studio, facilitando o início.
NeuralBeagle representa um avanço significativo no mundo dos modelos de IA de código aberto. Sua combinação inovadora de dois modelos e exploração de OPD de ajuste fino fornece informações sobre a evolução atual da IA. O modelo está agora disponível para pesquisadores, desenvolvedores e entusiastas de IA, que podem testá-lo e integrá-lo em seus trabalhos. Com testes online e opções de instalação local, o NeuralBeagle está preparado para se tornar uma ferramenta valiosa para a comunidade de IA.
Crédito da imagem mlabonne
Leia mais Guia:
- Comparação dos modelos Llama 2 70B e Zephyr-7B LLM
- Novo Mixtral 8x22B MoE, poderoso modelo de linguagem de código aberto (LLM)
- IA de código aberto Google Gemma otimizada para rodar em GPUs NVIDIA
- Lançado novo assistente de codificação de IA de código aberto DeepSeek
- O pequeno modelo de linguagem Orca-2 13B da Microsoft supera as alternativas de 70B
- OpenAI anuncia mudanças de preços do ChatGPT, modelos de integração e atualizações de API