Aguarde...

26 de julho de 2023

O que é o Llama 2 e como você pode usá-lo?

O que é o Llama 2 e como você pode usá-lo?

O Llama 2 da Meta está aqui, e é assim que você coloca as mãos nele.

Do GPT-4 da OpenAI ao PalM 2 do Google, grandes modelos de linguagem dominam as manchetes de tecnologia. Cada novo modelo promete ser melhor e mais potente que o anterior, por vezes superando qualquer concorrente existente.

No entanto, o número de modelos existentes não diminuiu o surgimento de novos. Agora, a empresa controladora do Facebook, a Meta, lançou o Llama 2, um novo e poderoso modelo de linguagem. Mas o que há de único no Llama 2? Como ele é diferente de GPT-4, PaLM 2 e Claude 2, e por que você deveria se importar?

O que é Lhama 2?

O que é o Llama 2 e como você pode usá-lo?

O Llama 2, um grande modelo de linguagem, é produto de uma aliança incomum entre a Meta e a Microsoft, dois gigantes da tecnologia concorrentes na vanguarda da pesquisa de inteligência artificial. É um sucessor do modelo de linguagem Llama 1 da Meta, lançado no primeiro trimestre de 2023.

Você pode dizer que é o equivalente da Meta ao PaLM 2 do Google, OpenAIs GPT-4 e Claude 2 da Anthropic. Ele foi treinado em um vasto conjunto de dados de Internet disponíveis publicamente, aproveitando a vantagem de um conjunto de dados mais recente e mais diversificado do que o usado para treinar o Llama 1. O Llama 2 foi treinado com 40% a mais de dados do que seu antecessor e tem o dobro do comprimento do contexto (4k).

Se você já teve a oportunidade de interagir com o Llama 1 no passado, mas não ficou muito impressionado com sua saída, o Llama 2 supera seu antecessor e pode ser exatamente o que você precisa. Mas como ele se sai contra a concorrência externa?

Como o Llama 2 se compara à concorrência?

O que é o Llama 2 e como você pode usá-lo?

Bem, depende da concorrência que está enfrentando. Em primeiro lugar, o Llama 2 é um projeto de código aberto. Isso significa que a Meta está publicando todo o modelo para que qualquer pessoa possa usá-lo para criar novos modelos ou aplicativos. Se você comparar o Llama 2 com outros grandes modelos de linguagem de código aberto, como Falcon ou MBT, descobrirá que ele os supera em várias métricas. É seguro dizer que o Llama 2 é um dos modelos de linguagem de código aberto mais poderosos do mercado atualmente.

No entanto, o Llama 2 perde a vantagem quando se depara com gigantes como o GPT da OpenAI e a linha de modelos de IA PalM do Google. Ao lidar com tarefas que exigem criatividade, o Llama 2 fica um pouco aqui e ali. Dependendo de qual variante você testar, você pode não obter resultados semelhantes aos dos modelos Anthropic e OpenAI.

Em sua defesa, o Llama 2 é principalmente um “modelo fundamental” e não um “ajuste fino”. Modelos fundamentais são grandes modelos de linguagem construídos com possíveis adaptações futuras em mente. Eles não são ajustados para nenhum domínio específico, mas são construídos para serem capazes de lidar com uma ampla gama de tarefas, embora, às vezes, com habilidades limitadas.

Por outro lado, um modelo ajustado é um modelo fundamental ajustado para aumentar sua eficiência em um domínio específico. É como pegar um modelo fundamental como o GPT e ajustá-lo no ChatGPT, para que possa ser usado pelo público em geral.

Como usar o Llama 2 agora mesmo

Embora o Llama 2 não esteja disponível em uma plataforma voltada para o público como o ChatGPT, você ainda pode obter o modelo baixando uma cópia do modelo e executando-o localmente ou acessando-o por meio de uma instância hospedada na nuvem do Hugging Face.

Para acessar o Llama on Hugging Face, basta abrir o link Hugging Face correspondente abaixo e começar a solicitar o AI chatbot.

  1. Parâmetros 7B Bate-papo Llama-2
  2. 13B parâmetros Llama-2 bate-papo
  3. Parâmetros 70B Bate-papo Llama-2

Os modelos Llama acima foram ajustados para aplicativos de conversação, por isso é o mais próximo do ChatGPT que você obterá para um modelo Llama-2. Não tem certeza de qual versão tentar? Recomendamos a opção três, os parâmetros 70B Llama-2 chat. Você ainda pode brincar com todos os três modelos para ver qual deles funciona melhor para suas necessidades exclusivas.

Levamos o bate-papo Llama-2 do parâmetro 70B da Meta para dar uma volta e os resultados foram impressionantes. Para testar sua criatividade e senso de humor, aplicamos nosso teste de criatividade e sarcasmo. Pedimos ao modelo de IA para simular uma conversa entre duas pessoas discutindo sobre os méritos de ir ao espaço, e aqui estão os resultados.

Seguido pela:

E finalmente:

Não acertou todos os detalhes em nossas instruções, mas o humor foi impressionante.

Por outro lado, se você tiver a profundidade técnica para executar o modelo Llama localmente em sua máquina, poderá solicitar acesso ao modelo usando o formulário de solicitação de acesso ao Llama da Meta. Depois de fornecer um nome, e-mail, localização e o nome da sua organização, a Meta revisará sua inscrição, após o que o acesso será negado ou concedido dentro de uma janela de algumas horas a dois dias. Meu acesso foi concedido em minutos, então espero que você tenha sorte também.

Llama 2: um primeiro passo importante

O Llama 2 pode não ser o modelo de linguagem mais sofisticado disponível, mas por ser de código aberto, representa um primeiro passo importante para o desenvolvimento de IA transparente e progressivo.

Enquanto OpenAI GPT atualmente tem melhor desempenho, a abordagem de desenvolvimento do OpenAI significa que o crescimento e o ritmo de desenvolvimento do modelo são controlados pela empresa. Com um modelo de código aberto como o Llama, a comunidade mais ampla de código aberto pode inovar iterativamente para criar novos produtos que podem não ser possíveis em um sistema de jardim murado.

Postado em BlogTags:
Escreva um comentário