Baseado em rumores, pesquisador especula como estaria sendo treinado o Q*

27/11/2023 Thiago Guimarães IA

Baseado em rumores, pesquisador especula como estaria sendo treinado o Q*, modelo que teria desencadeado a demissão de Sam Altman da OpenAI: a metodologia se destaca por utilizar dados sintéticos e por abordar o raciocínio em várias etapas, combinando RLHF (aprendizado por reforço com feedback humano, na sigla em inglês) com a otimização de dados de raciocínio através de PRMs (modelos preditivos de recompensa).

O processo inclui coletar prompts apropriados, gerar etapas de raciocínio eficazes e pontuar precisamente milhares de conclusões usando recursos computacionais extensos.

Há rumores de que grandes empresas de tecnologia estão desenvolvendo datasets de treinamento enormes para esses algoritmos.

As informações são do Substack de Nathan Lambert.

Thiago Guimarães

Deixe comentário Cancelar resposta

Você precisa fazer o login para publicar um comentário.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Upeex: Transformando a publicidade online em uma experiência simples e eficiente

Exposição na Câmara comemora os 35 anos do domínio “.br”, utilizado em sites brasileiros

Registros de uma era pré nuvem e pré virtualização

Governo sinaliza que órgãos deveriam utilizar serviço de nuvem hospedado no Brasil

OpenAI quer desenvolver e fabricar seus próprios chips aceleradores de IA

28/04/2024

Baseado em rumores, pesquisador especula como estaria sendo treinado o Q*

Deixe comentário Cancelar resposta

Upeex

Parceiros

Recent Posts

Recent Comments