NeuralBeagle14-7B novo e poderoso modelo de IA de código aberto da 7B

O campo da inteligência artificial acaba de dar as boas-vindas a um novo modelo de linguagem de inteligência artificial (IA) na forma de NeuralBeagle14-7B. Este modelo avançado de IA está agitando com seus 7 bilhões de parâmetros e rapidamente subiu na classificação para se tornar um concorrente líder entre os grandes modelos de linguagem.

NeuralBeagle não é um modelo como qualquer outro; é um híbrido, criado combinando as melhores características de dois modelos existentes, Beagle e Mar Coro. Essa fusão foi aprimorada ainda mais por uma técnica exclusiva chamada Lazy Merge Kit. NeuralBeagle14-7B é um ajuste DPO de mlabonne/Beagle14-7B usando o conjunto de dados de preferência argilla/distilabel-intel-orca-dpo-pairs.

Mergekit é um kit de ferramentas para mesclar modelos de linguagem pré-treinados. O Mergekit usa uma abordagem externa para realizar fusões excessivamente elaboradas em situações com recursos limitados. As mesclagens podem ser executadas inteiramente na CPU ou aceleradas com apenas 8 GB de VRAM. Muitos algoritmos de fusão são suportados e outros estão em desenvolvimento.

O sucesso do NeuralBeagle baseia-se no alto desempenho do modelo Beagle, que já havia demonstrado suas capacidades ao alcançar bons resultados em um conhecido ranking de IA. Ao integrar o Beagle ao Mar Coro, os desenvolvedores criaram um modelo poderoso que aproveita os pontos fortes de ambos. Mas a equipe não parou por aí. Também aplicou um processo de refinamento conhecido como “Opção Preferencial de Domínio” (DPO). Embora este ajuste fino não tenha melhorado radicalmente o desempenho do modelo, forneceu informações importantes sobre o processo de ajuste fino e os seus efeitos nos modelos de IA.

NeuralBeagle14-7B

NeuralBeagle se destaca pela versatilidade. Foi rigorosamente testado em diversas plataformas, incluindo AGI Evol e GPT-4-All, demonstrando sua capacidade de realizar uma ampla gama de tarefas. Essa adaptabilidade demonstra o design sofisticado do modelo e suas possibilidades de utilização em diversas aplicações. NeuralBeagle14-7B usa pop-up de 8k. É compatível com diferentes modelos, como chatml e modelo de chat Llama. NeuralBeagle14-7B está classificado em primeiro lugar no Open LLM Leaderboard na categoria ~7B.

Para os interessados ​​em ver o NeuralBeagle em ação, o modelo está disponível para experimentar no Hugging Face Spaces. Esta plataforma interativa permite que os usuários interajam diretamente com o NeuralBeagle e vejam como ele funciona. E para quem deseja integrar o NeuralBeagle em seus próprios projetos, há instruções detalhadas de instalação do LM Studio, facilitando o início.

NeuralBeagle representa um avanço significativo no mundo dos modelos de IA de código aberto. Sua combinação inovadora de dois modelos e exploração de OPD de ajuste fino fornece informações sobre a evolução atual da IA. O modelo está agora disponível para pesquisadores, desenvolvedores e entusiastas de IA, que podem testá-lo e integrá-lo em seus trabalhos. Com testes online e opções de instalação local, o NeuralBeagle está preparado para se tornar uma ferramenta valiosa para a comunidade de IA.

Crédito da imagem mlabonne

Leia mais Guia:

Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios estão marcados com *