OpenAI lança o Operator—um agente que pode usar um computador por você
Este de fato pode ser o ano dos agentes
Isso não vai ser um pesadelo de privacidade?
A demonstração foi decepcionante, mas acho que isso pode ser extremamente interessante para mim usar com Google Sheets. Talvez tenha que esperar pelo operador do Gemini para isso, no entanto.
Do artigo:
Após semanas de burburinho, a OpenAI lançou o Operator, seu primeiro agente de IA. O Operator é um aplicativo web que pode realizar tarefas simples online em um navegador, como reservar ingressos para shows ou preencher um pedido de supermercado online. O aplicativo é alimentado por um novo modelo chamado Agente que Usa Computador—CUA, para abreviar—construído com base no modelo de linguagem multimodal GPT-4o da OpenAI.
O Operator está disponível hoje em operator.chatgpt.com para qualquer pessoa inscrita no ChatGPT Pro, o serviço premium de US$200 por mês da OpenAI. A empresa diz que planeja expandir a ferramenta para outros usuários no futuro.
A OpenAI afirma que o Operator supera ferramentas rivais similares, incluindo o Computer Use da Anthropic (uma versão do Claude 3.5 Sonnet que pode realizar tarefas simples em um computador) e o Mariner do Google DeepMind (um agente de navegação na web construído com base no Gemini 2.0).
O fato de três das maiores empresas de IA do mundo terem convergido na mesma visão do que os modelos baseados em agentes poderiam ser torna uma coisa clara: a batalha pela supremacia em IA tem uma nova fronteira—e ela é nossas telas de computador.
Isso não é só Computer use tool - Anthropic ?
IA está estranha agora mesmo, para quem não é programador, já é muito insano. Eu não uso o Google, uso o GPT na maior parte do tempo. Penso no que faria a IA “louca” para mim de novo—talvez se fosse uma conversa de voz realmente integrada (no começo a voz era incrível, mas agora conheço bem os limites). Até o ponto de ter uma conversa verdadeira enquanto caminha. Outra coisa seria fazer a edição bruta no Premiere Pro.
Sei que o desenvolvimento de IA está em velocidade de luz, mas acho que para a pessoa comum, é tipo… ok, uma lista de afazeres… okkkk, pode comprar minhas compras por mais 200 por mês. O progresso parece lento de certa forma.
O Operator é treinado para perguntar proativamente ao usuário se deve assumir tarefas que requerem login, dados de pagamento ou ao resolver CAPTCHAs.
É absurda a ideia de fingir que não pode resolver esses malditos CAPTCHAs melhor do que eu.
Não. Ainda não. Pro ainda não vale a pena.
Com a liberação dos agentes, me pergunto se teremos agentes que acionam outros agentes em uma rede continuamente em desenvolvimento.
Se você quer evitar spam de blog, aqui está a página de anúncio real: https://openai.com/index/introducing-operator/
Nova farsa indiana a caminho
Olá, aqui é o John Smith do jatgbti, baixe este arquivo, por favor.
Esse recurso é exclusivo para usuários Pro (US$200). Além disso, não confiaria na ClosedAI com meu computador.
A demonstração foi horrenda. Comprar ingressos ou reservar uma mesa em um restaurante com o dobro do transtorno e três vezes mais lento do que fazer sozinho provavelmente é o pior produto de todos, especialmente se você tiver que usar o teclado para conversar com o negócio. Mesmo se funcionasse perfeitamente, uma alucinação pode ter consequências catastróficas.
Então automação de tela via UiPath?
Por favor, venha limpar minha casa e meus banheiros em vez disso
Demonstração bem legal. Dá para ver os blocos de construção, mas ainda tem muito caminho a percorrer.
Mas, assim como vimos com modelos de vídeo em 2024, as coisas podem acelerar rapidamente!
Como ele se sai com o CAPTCHA?
quando posso usar para ligar para todas as minhas empresas de utilidades/telefonia/seguro a cada 6 meses e ameaçar de desistir, a menos que tornem as coisas mais baratas?
