На вихідних Meta представила дві нові моделі штучного інтелекту Llama 4 – легку Scout і середньоформатну Maverick, яка, за їхніми словами, перевершує відому конкуренцію в широкому спектрі тестів. Проте, згідно з The Verge, статистика від Meta може бути обманливою. У пресрелізі компанії йшлося про вражаючий результат Maverick у рейтингу LMArena, де вона виявилася на другому місці з високим ELO-рейтингом, але виявилося, що тестувалася не публічна версія моделі, а експериментальний варіант, створений для кращої взаємодії в чаті. LMArena висловила незадоволення Meta через використання спеціально оптимізованої моделі для тестів, внаслідок чого вони переглядають свої правила, щоб уникнути подібних ситуацій у майбутньому.