Como a nova Inteligência Artificial Kimi K2.5 pode mudar o seu dia a dia?
A empresa responsável pela novidade lança um sistema gratuito que entende vídeos e fotos simultaneamente, e permite que múltiplos agentes virtuais trabalhem juntos para solucionar as tarefas do lar e do escritório
Embora a linguagem pareça complicada, o uso é simples. O morador de uma casa pode filmar os azulejos antigos da cozinha e pedir referências de renovação ao assistente, ou registrar o ruído de um eletrodoméstico falho para descobrir a possível raiz do defeito
00:00
A+A-
A Moonshot AI, startup fundada em 2023 em Pequim, lançou a Kimi K2.5, ferramenta de IA multimodal que processa textos, vozes e imagens de forma unificada.
A tecnologia possui capacidade para analisar até 256.000 tokens por diálogo e usa o sistema Agent Swarm, que coordena até 100 subagentes autônomos para executar tarefas complexas.
O sistema é open source, com código liberado gratuitamente em janeiro de 2026, permitindo que desenvolvedores e usuários utilizem a tecnologia sem custos de assinatura.
A ferramenta visa otimizar o cotidiano doméstico e o trabalho remoto, permitindo desde análise de documentos extensos até identificação de problemas em eletrodomésticos por meio de vídeos.
A busca por soluções digitais que otimizem o nosso tempo em casa e facilitem o trabalho remoto ganha um novo capítulo. O ToqueTec acompanhou o lançamento da Kimi K2.5, a mais nova ferramenta de inteligência artificial que chega ao cenário tecnológico prometendo revolucionar a forma como as pessoas interagem com os computadores.
Diferente dos assistentes virtuais convencionais que apenas respondem perguntas simples por meio de textos curtos, essa nova plataforma atua como uma equipe completa de ajudantes. Ela consegue enxergar fotografias, assistir a vídeos longos e resolver dezenas de pendências ao mesmo tempo.
A inteligência é a criação de maior destaque da Moonshot AI, uma startup de origem asiática, fundada em 2023. A instituição corporativa mantém a sua sede principal instalada em Pequim, na China, e nasceu com a missão de estruturar sistemas computacionais que aprendem continuamente, visando aproximar o nível de compreensão das máquinas ao raciocínio humano natural.
Em muito pouco tempo de atuação no segmento, a empresa atraiu o interesse do mercado e recebeu grandes injeções de capital financeiro de corporações gigantes da internet, como o grupo Alibaba. Atualmente, ela desponta como uma das potências globais na construção de robôs de conversação.
Como funciona e o que faz a tecnologia
A característica principal do modelo Kimi K2.5 consiste no seu funcionamento arquitetônico multimodal nativo. Na linguagem técnica, isso significa que o sistema não depende de extensões separadas para ler um documento de texto, ouvir uma voz ou identificar os detalhes de uma fotografia. A máquina avalia tudo de modo unificado e veloz, por meio de um avançado recurso de visão computacional que os seus criadores batizaram de MoonViT.
Embora a linguagem pareça complicada, o uso é simples. O morador de uma casa pode filmar os azulejos antigos da cozinha e pedir referências de renovação ao assistente, ou registrar o ruído de um eletrodoméstico falho para descobrir a possível raiz do defeito. O aparelho examina a mídia enviada e devolve instruções exclusivas e adequadas ao contexto.
Além do foco em imagens interativas, a programação carrega uma capacidade de leitura contínua massiva, podendo nalisar até 256.000 tokens (blocos de palavras do formato digital) em uma só janela de diálogo. Na rotina daqueles profissionais que operam no modelo de home office, a plataforma agiliza a verificação de arquivos que possuem dezenas de páginas em questão de segundos. A inteligência filtra relatórios complexos, balanços financeiros ou propostas comerciais para extrair e apresentar apenas as informações primordiais e essenciais para a tomada de decisão.
As grandes vantagens do sistema chinês
O grande diferencial técnico desta versão é uma funcionalidade engenhosa que os engenheiros da empresa definiram como Agent Swarm (Enxame de Agentes). Esse formato de processamento transforma o ajudante em um verdadeiro gerente digital. Quando o usuário expede um pedido de múltiplas fases, como estruturar os custos e pesquisar as acomodações de uma viagem de férias, a inteligência originária convoca e distribui as demandas para até 100 subagentes virtuais autônomos. Cada agente secundário cruza informações em rotas distintas e devolve os dados para o cérebro principal simultaneamente, solucionando o problema quase cinco vezes mais rápido do que os programas predecessores faziam.
A agilidade proporcionada pela técnica do enxame reflete na elevação da produtividade geral do cotidiano. O robô apresenta também um modo analítico de pensamento profundo, feito para desvendar quebra-cabeças complexos de raciocínio lógico e redigir linhas extensas de programação. Os especialistas indicam que o patamar de desempenho obtido a partir dessa inteligência coletiva de agentes coloca o equipamento em paridade imediata com as opções eletrônicas pagas mais robustas do mundo inteiro.
Disponibilidade para o acesso do público
Para as famílias e os profissionais que buscam experimentar o avanço da computação nas próprias residências, o detalhe mais atrativo engloba o sistema de liberação comercial do Kimi K2.5. A empresa optou pelo open source (código aberto). As bases do programa foram lançadas publicamente e liberadas de forma no final de janeiro de 2026. Não ocorrem bloqueios por regiões ou assinaturas caras para utilizar os códigos basilares do projeto.
Dessa forma, os desenvolvedores de softwares ou usuários dedicados conseguem adotar a tecnologia sem barreiras e incorporar as vantagens exclusivas do robô na construção de aplicativos próprios, barateando a inteligência dentro das nossas casas.
Este conteúdo foi criado com auxílio de inteligência artificial e supervisionado por um jornalista do ToqueTec