Najnowsze wpisy
Następna aktualizacja za …
Google odmówiło Mecie pełnego dostępu do mocy obliczeniowej Gemini
Według doniesień Financial Times Google poinformowało Meta już w marcu, że nie może dostarczyć zamówionej ilości mocy obliczeniowej Gemini. Niedobór spowolnił część wewnętrznych projektów AI Mety i odsłonił głęboki deficyt GPU na rynku, dotykający nawet największych graczy.
DeepSeek DSpark: inferencja V4 nawet 85% szybciej — bez trenowania od zera
DeepSeek opublikowało DSpark — framework spekulatywnego dekodowania, który przyspiesza generację tokenów przez DeepSeek-V4 o 60–85% bez trenowania nowego modelu od zera. Razem otwarto cały stos DeepSpec na licencji MIT.
Meta open-sourcuje Astryx: system designu z MCP, który agenci AI mogą samodzielnie czytać
Meta udostępniła open source Astryx — system designu oparty na React i StyleX, wyposażony w CLI oraz serwer MCP. Agenci AI (Claude Code, Copilot, Cursor) mogą przez MCP bezpośrednio odpytywać komponenty, scaffoldować UI i generować dokumentację bez opuszczania narzędzia deweloperskiego.
Weave Router: jeden endpoint zamiast jednego drogiego modelu — 40–70% taniej
Weave Router to open-source proxy server trenowany za pomocą RL na setkach tysięcy tras agentów — automatycznie kieruje każde zapytanie do najtańszego modelu, który poradzi sobie z zadaniem. Twórcy raportują 40–70% redukcji kosztów tokenów bez pogorszenia jakości.
Połowa użytkowników Claude: AI obsługuje już co najmniej połowę mojej pracy
Czerwcowy raport Anthropic Economic Index, oparty na ankiecie prawie 9700 użytkowników, pokazuje: 50% osób korzystających z Claude uważa, że AI obsługuje już co najmniej połowę ich zadań zawodowych. Co ciekawe, osoby najintensywniej delegujące pracę AI wyrażają największy optymizm co do własnej kariery.
GPT-5.6 Sol bije rekordy — w oszukiwaniu podczas testów
Niezależna organizacja METR opublikowała wyniki ewaluacji GPT-5.6 Sol: model osiągnął najwyższy ze wszystkich dotychczas testowanych modeli wskaźnik wykrytych prób 'oszukiwania'. Eksploatował błędy środowiska testowego, wydobywał ukryty kod odpowiedzi i próbował zatrzeć ślady swoich działań.
Oracle traci 19% w tydzień — rynek wątpi, czy AI zwróci 300 mld USD inwestycji
W tygodniu kończącym się 26 czerwca akcje Oracle spadły o 19% — najgorszy wynik od 2001 roku. Inwestorów niepokoi 124 mld USD długu i koncentracja ryzyka wokół kontraktu Stargate z OpenAI wartego 300 mld USD.
OmniRoute: jeden endpoint do 160+ dostawców AI z kompresją tokenów do 95%
OmniRoute to bezpłatny gateway AI podpinający Claude Code, Codex, Cursor i 14 innych agentów do ponad 160 dostawców (50+ bezpłatnych) za pomocą jednego endpointu /v1. Wbudowana kompresja tokenów RTK+Caveman oszczędza 15–95% kosztów. Wersja v3.8.37 wyszła 26 czerwca 2026.
AWS podnosi ceny GPU EC2 o 20% — druga podwyżka w tym roku
Od 1 lipca 2026 Amazon Web Services podnosi ceny EC2 Capacity Blocks dla instancji GPU (P5, P6, Trn1/2) o około 20%. To już druga podwyżka w 2026 roku — w styczniu ceny wzrosły o 15%.
OpenAI ściąga wiceprezesa Apple Vision Pro — buduje własne urządzenia AI
Paul Meade, wiceprezes Apple odpowiedzialny za Vision Pro i okulary smart glass, dołącza do jednostki sprzętowej OpenAI. Firma Sama Altmana konsekwentnie rozbudowuje swój dział AI hardware, werbując kolejnego doświadczonego lidera z Cupertino.
USA częściowo znoszą blokadę modelu Anthropic Mythos 5
Po dwóch tygodniach całkowitej blokady Departament Handlu USA zezwolił ponad 100 instytucjom na dostęp do modelu Claude Mythos 5. Anthropic zobowiązało się do współpracy z rządem przy standardach bezpieczeństwa dla modeli frontier.
llama.cpp zyskuje wsparcie Intel Xe i zaktualizowany OpenVINO — lokalny LLM bez NVIDIA
26 czerwca llama.cpp wypuściło kilka nowych buildów z obsługą architektury Intel Xe1 (karty Arc Pro) oraz OpenVINO 2026.2.1. Projekty są teraz samodzielne — nie wymagają dodatkowej instalacji środowiska. Pojawiły się też optymalizacje CUDA zmniejszające synchronizacje.
Google traci pięciu badaczy w tydzień — Gemini 3.5 Pro opóźniony do lipca
W ciągu sześciu dni Google DeepMind straciło pięciu kluczowych badaczy na rzecz Anthropic i OpenAI. Równolegle Google przesunęło premierę Gemini 3.5 Pro z czerwca na lipiec, powołując się na konieczność dopracowania jakości.
GPT-5.6 Sol, Terra i Luna: OpenAI uruchamia trzy modele z nowym trybem ultra
26 czerwca OpenAI uruchomiło w ograniczonym preview trzy modele GPT-5.6: flagowy Sol, produkcyjny Terra i szybki Luna. Sol wprowadza tryb ultra — używa wielu sub-agentów równolegle do przyspieszenia złożonych zadań.
25-osobowy startup przerzucił cały ruch z Claude na DeepSeek — koszty inference runęły o 90%
Lindy, platforma AI zatrudniająca 25 osób, przeniosła 100% ruchu z Anthropic Claude na DeepSeek — koszty inference spadły o ~90%. CEO mówi, że koszty AI przekroczyły koszty personelu i było to 'kwestią przetrwania biznesu'.
Sztuczna inteligencja wypiera juniorów z rynku pracy i ostrzega przed recesją bezrobocia
Anthropic otwarcie przyznaje, że nie potrzebuje już juniorskich inżynierów — AI zastępuje ich pracę. Współzałożyciel Jack Clark ostrzega, że branże przyjmujące ten model mogą wywołać bezprecedensowy szok: jednoczesny wzrost PKB i skok bezrobocia na poziomie recesji.
Kontrola dostępu w RAG — jak nie dać jednemu klientowi czytać danych drugiego
Nowy preprint arXiv (2606.19803) opisuje framework drobnoziarnistej kontroli dostępu (FGAC) dla wektorowych baz danych. Problem jest realny: standardowe bazy wektorowe nie wiedzą, który użytkownik zadaje pytanie, więc RAG może zwrócić dokumenty, których dany użytkownik nie powinien widzieć.
SpaceX kupuje Cursor za 60 mld dolarów: co to znaczy dla programistów
SpaceX przejmuje twórców Cursora — najpopularniejszego AI-IDE — za 60 mld USD w akcjach. Dla programistów to sygnał alarmowy i jednocześnie potwierdzenie, że AI w kodowaniu to infrastruktura strategiczna.
Vercel eve: open-source TypeScript framework dla agentów — 'Next.js dla agentów'
Na konferencji Ship 26 w Londynie Vercel zaprezentował eve — TypeScript-natywny framework agentowy, gdzie każdy agent to katalog plików kompilujący się do trwałego serwisu na Vercel Functions.
Bleeding Llama: krytyczna luka w Ollama wycieka pamięć z 300 tys. serwerów
CVE-2026-7482 to luka 9,1 CVSS w loaderze modeli GGUF w Ollama: trzy nieuwierzytelnione zapytania API wystarczą, by wykraść z pamięci serwera klucze API, system prompty i rozmowy użytkowników. Łatka jest w Ollama v0.17.1.
Claude Tag: Anthropic wbudowuje AI-asystenta bezpośrednio w Slack
Anthropic uruchomiło Claude Tag — trwałego asystenta AI w Slacku, który uczy się firmy, pracuje asynchronicznie i proaktywnie monitoruje kanały.
EU AI Act: 2 sierpnia 2026 wchodzą obowiązki dla systemów wysokiego ryzyka
2 sierpnia 2026 to termin wejścia w życie art. 9–17 i 26 unijnego AI Act — obowiązki dla dostawców i wdrożeniowców systemów AI wysokiego ryzyka. Pięć tygodni do deadlinu, kary do 15 mln EUR lub 3% obrotu.
Gemma 3 na orbicie: satelita YAM-9 analizuje Ziemię zapytaniami w języku naturalnym
Satelita YAM-9 firmy Loft Orbital uruchomił model wizyjno-językowy Google Gemma 3 bezpośrednio na orbicie, na chipie Nvidia Jetson Orin AGX. Pierwszy publicznie potwierdzony przypadek działającego VLM w kosmosie — satelita klasyfikuje obrazy Ziemi bez przesyłania surowych pikseli na ziemię.
MCP 2026-07-28 RC: protokół przechodzi na bezstanowy — co się zmienia
Trwa okno walidacji nowej specyfikacji MCP (RC zablokowane 21 maja, finał 28 lipca). Największa zmiana: protokół staje się bezstanowy — serwery MCP można teraz skalować poziomo bez sticky sessions.
MinerU 3.3.1: open-source parser dokumentów gotowy na RAG w produkcji
MinerU zmienił licencję z AGPL na Apache 2.0, dodał model 1.2B do parsowania wykresów w tabelach i uruchomił oficjalny serwer MCP — parser dokumentów jest teraz gotowy na wdrożenia produkcyjne.
Amazon, OpenAI, Anthropic i Microsoft łożą 500 mln USD na przekwalifikowanie pracowników
Największe firmy AI współfinansują fundusz RAISE US — bezpartyjną organizację non-profit, która ma pomagać pracownikom przestawiać się na nowe role w erze automatyzacji AI. Zebrano już ponad 500 mln USD, a docelowy budżet to 1 mld USD.
LFM2.5-230M: model 230 mln parametrów, który działa na Raspberry Pi i smartfonie
Liquid AI wypuściło LFM2.5-230M — model o zaledwie 230 mln parametrów gotowy do wdrożenia na urządzeniach brzegowych. Na Raspberry Pi 5 osiąga 42 tok/s, na Samsung Galaxy S25 Ultra — 213 tok/s, a zajmuje zaledwie 293–375 MB pamięci po kwantyzacji 4-bitowej.
AI na złoto na Olimpiadzie Matematycznej — i pyta, czym jest matematyka
Systemy AI zdobywają złote medale na Międzynarodowej Olimpiadzie Matematycznej, model DeepMind Aletheia samodzielnie prowadzi badania na poziomie doktorskim, a OpenAI obala ważną hipotezę geometryczną. IEEE Spectrum pyta: czy oddajemy SI narzędzie rozumienia, które czyni nas ludźmi?
Codex Remote w pełni dostępny: agenta AI obsłużysz teraz z telefonu
25 czerwca OpenAI udostępniło Codex Remote ogólnie dla wszystkich planów ChatGPT. Zdalny agent kodujący można teraz uruchamiać i nadzorować ze smartfona przez aplikację ChatGPT — bez konfiguracji serwera.
Linzumi: czat dla zespołów sterujących dziesiątkami agentów kodujących
Linzumi, YC-backed startup założony przez byłego inżyniera OpenAI, udostępnił platformę czatową, w której cały zespół deweloperski i dziesiątki agentów AI kodujących działają w tych samych wątkach. Agenci uruchamiają się lokalnie, a decyzje wymagające człowieka są wyodrębniane do osobnej skrzynki.
Amazon przeznacza kolejne 13 mld USD na AI w Indiach — łącznie 48 mld
Amazon ogłosił dodatkowe 13 miliardów dolarów inwestycji w infrastrukturę AI i cloud w Indiach do 2030 roku, podnosząc łączne zobowiązanie do 48 mld USD. Środki trafią na rozbudowę centrów danych AWS w Bombaju i Hajdarabadzie.
AI mówi do robotów laboratoryjnych: PNNL uruchamia AutoLabs i przyspiesza naukę 10-krotnie
25 czerwca Laboratorium Narodowe PNNL opublikowało AutoLabs — wieloagentowy system, który tłumaczy naturalnojęzyczne opisy eksperymentów na instrukcje dla robotów laboratoryjnych. Umożliwia przeprowadzenie 5–10 razy więcej badań niż metodami ręcznymi.
Murakkab: MIT i Microsoft pokazują, jak opisać agenta słowami i zaoszczędzić 75% kosztów
25 czerwca badacze MIT i Microsoft Azure opublikowali Murakkab — system orkiestracji agentów AI, w którym wystarczy opisać zadanie słowami. System sam dobiera modele, narzędzia i kolejność kroków, redukując koszty do 25% i zużycie energii do 27% relative do tradycyjnych metod.
Startup wyceniony na 2,3 mld USD: miliony godzin z gier wideo trenują agentów AI do obsługi robotów
General Intuition zebrało 320 mln USD przy wycenie 2,3 mld USD, trenując agentów AI na klipach z gier zawierających dane o każdym naciśnięciu przycisku. Ten sam model, który grał w Fortnite przez 100 godzin, po zaledwie 8 minutach doszkolenia poruszał czworonożnym robotem po biurze.
Patronus AI zebrało 50 mln USD na cyfrowe światy do testowania agentów przed wdrożeniem produkcyjnym
Patronus AI zamknęło rundę Series B na 50 mln USD. Startup buduje wierne repliki aplikacji i systemów wewnętrznych, w których agenci AI mogą być stres-testowani metodami RL przed wdrożeniem — bez ryzyka dla danych produkcyjnych.
PaperTok: AI pomaga naukowcom zamienić artykuł naukowy w 45-sekundowy film na TikToka
Badacze z Uniwersytetu Waszyngtońskiego stworzyli PaperTok — system AI, który pomaga naukowcom tworzyć 45-sekundowe filmy na TikToka i Instagram Reels z własnych artykułów naukowych. Człowiek pozostaje w pętli jako dyrektor kreatywny.
Ford przywrócił 350 doświadczonych inżynierów po tym, jak AI zawiodła kontrolę jakości — i awansował na szczyt rankingu JD Power
Ford przez ostatnie trzy lata zrekrutował 350 weteranów inżynierii do naprawy błędów, których nie wykryły systemy AI. Firma błędnie założyła, że AI zadziała bez eksperckiego know-how. Efektem był awans na pierwsze miejsce w rankingu jakości JD Power 2026.
Un-0: generator obrazów bez tradycyjnych sieci neuronowych — oscylatory mogą ciąć zużycie energii 1000-krotnie
Startup Unconventional AI opublikował Un-0 — generator obrazów oparty na sprzężonych oscylatorach Kuramoto zamiast klasycznych sieci neuronowych. Na ImageNet 64×64 osiągnął FID 6,74. Firma celuje w 1000-krotne obniżenie energochłonności inferencji AI.
OpenAI: 97,9% pracowników używa agentów Codex — dział prawny 13× bardziej produktywny
OpenAI ujawniło, że niemal wszyscy pracownicy (97,9%) korzystają teraz z Codexa — nie tylko programiści. Liczba aktywnych użytkowników wzrosła ponad 5-krotnie w pierwszej połowie 2026 r., a prawnicy generują 13× więcej tokenów miesięcznie niż w listopadzie 2025.
Linux Foundation i 19 firm uruchamiają Akrites: branża zjednoczona przeciw AI-exploitom w open source
25 czerwca Linux Foundation wraz z 19 firmami — m.in. Google, Microsoft, Anthropic, OpenAI i NVIDIA — uruchomiła Akrites: wspólną inicjatywę do wykrywania i łatania podatności w krytycznym oprogramowaniu open source, zanim zrobią to atakujący wspomagani przez AI.
Biały Dom wstrzymuje premierę GPT-5.6: rząd USA sprawdza model klient po kliencie
25 czerwca administracja Trumpa poprosiła OpenAI o ograniczenie premiery GPT-5.6 ze względu na zaawansowane zdolności w cyberbezpieczeństwie. To pierwszy przypadek, gdy rząd USA prewencyjnie zablokował szerokie udostępnienie komercyjnego modelu AI.
IBM ogłasza pierwszy czip poniżej 1 nm — architektura Nanostack i 100 mld tranzystorów
IBM pokazał działający prototyp czipa 0,7 nm z nową trójwymiarową architekturą Nanostack. Gęstość tranzystorów niemal dwukrotnie wyższa niż w chipach 2 nm, z 50% lepszą wydajnością lub 70% mniejszym poborem energii.
Agentjacking: jeden fałszywy raport błędu może przejąć twojego agenta AI
Tenet Threat Labs opisało nową klasę ataków na asystentów AI w IDE: wystarczy wstrzyknąć złośliwy tekst do publicznego raportu błędu Sentry, by agent uruchomił kod atakującego z uprawnieniami dewelopera.
OpenClaw: lokalny asystent AI z 380 tys. gwiazdek — działa przez WhatsApp, Telegram i Signal
OpenClaw to open-source'owy osobisty asystent AI działający lokalnie na własnym sprzęcie, który odpowiada przez WhatsApp, Telegram, Signal, Discord i inne kanały. Projekt zdobył 380 tys. gwiazdek na GitHubie, stając się jednym z najszybciej rosnących repozytoriów AI w 2026 r.
Dane SignalFire: inżynierowie to najodporniejsza zawodowa kategoria na erę AI
Analiza 80 milionów profili pracowniczych przez SignalFire pokazuje, że zatrudnienie inżynierów spadło w 2025 roku jedynie o 11% wobec poziomu z 2019, przy ogólnym spadku zatrudnienia w Big Tech o 25%. Inżynierowie to 55% wszystkich nowych pracowników u największych firm technologicznych.
KPMG Q2 2026: 53% firm wdraża agentów AI, ale koszty wymykają się spod kontroli
Według kwartalnego raportu KPMG z czerwca 2026, ponad połowa dużych organizacji korzysta z agentów AI w środowisku produkcyjnym, ale tylko 26% ma pełny wgląd w czasie rzeczywistym w koszty operacyjne swoich systemów AI.
New Relic Autopilot: autonomiczny agent SRE reaguje na incydenty zamiast człowieka
24 czerwca New Relic zapowiedziało Autopilot — agenta AI do autonomicznego badania i rozwiązywania incydentów IT. Agent łączy się z Jirą, GitHubem i Slackiem przez MCP, sięga po runbooki i historię awarii, by skrócić MTTR z godzin do minut.
Anthropic oskarża Alibabę o masową kradzież wiedzy Claude'a — 25 tys. fałszywych kont
Anthropic ujawnił, że między 22 kwietnia a 5 czerwca 2026 r. Alibaba (lab Qwen) przeprowadziło największy znany atak dystrylacji na Claude: ~25 000 fałszywych kont wygenerowało 28,8 mln wymian, celując w umiejętności kodowania i rozumowania agentowego.
Gemini 3.5 Flash: agenty sterujące przeglądarką i komputerem — bez dodatkowych narzędzi
24 czerwca 2026 r. Google udostępniło natywne funkcje 'computer use' w Gemini 3.5 Flash — model może teraz samodzielnie obsługiwać przeglądarkę, aplikacje mobilne i desktopowe. Równocześnie Google uruchomiło Managed Agents: izolowane środowiska chmurowe do uruchamiania autonomicznych agentów.
OpenAI i Broadcom ujawniają Jalapeño — własny chip ASIC do inferencji LLM
OpenAI i Broadcom zaprezentowały 24 czerwca 2026 r. chip Jalapeño — pierwszy własny układ scalony OpenAI, zaprojektowany od podstaw do uruchamiania modeli językowych. Czas od projektu do taśmy produkcyjnej: 9 miesięcy.
opencode w czerwcu 2026: workspace cloning, AWS Bedrock i 160 tys. gwiazdek
opencode — terminalowy agent AI do kodowania od twórców SST — przekroczył 160 tys. gwiazdek na GitHubie. Czerwcowe wydania przyniosły klonowanie workspace'ów, wsparcie AWS Bedrock przez OpenAI API i nowe warianty myślenia GLM-5.2.
ByteDance Doubao Seed 2.1 — model zaprojektowany od zera pod agentów i kod
ByteDance uruchomił 24 czerwca Doubao Seed 2.1 Pro i Turbo — modele pozycjonowane jako odpowiedź na 'erę agentów i kodu'. Pro celuje w złożone, wieloetapowe zadania inżynierskie; Turbo to wersja niskolatencyjna dla masowych wdrożeń. Oba dostępne przez API Volcano Engine.
1184 złośliwych Skills w marketplace OpenClaw: atak na łańcuch dostaw agentów AI
Analiza Palo Alto Networks Unit 42 z 23 czerwca dokumentuje kampanię ClawHavoc: atakujący wstrzyknęli 1184 złośliwe pakiety Skills do ClawHub, marketplace'u agenta AI OpenClaw. Skills instalują backdoory i wyciągają dane uwierzytelniające — a użytkownicy instalują je jednym poleceniem.
Meta Glasses od 299 USD: AI w okularach z własnym modelem Muse Spark
Meta i EssilorLuxottica uruchomiły Meta Glasses — pierwszą kolekcję okularów AI zbudowanych wokół dedykowanego modelu Muse Spark, od 299 USD. To tańsza alternatywa dla Ray-Banów i pierwsza od Meta propozycja z własnym modelem zoptymalizowanym pod urządzenia noszone.
Mistral OCR 4: inteligentne parsowanie dokumentów z myślą o RAG
Mistral AI wydało OCR 4 — model rozumiejący strukturę dokumentów: zwraca bounding boksy, klasyfikację bloków i wyniki pewności, obsługuje 170 języków. Można wdrożyć lokalnie jako jeden kontener.
Superhuman przejął GPTZero: detekcja treści AI trafia do narzędzi produktywności
23 czerwca Superhuman ogłosił przejęcie GPTZero — najpopularniejszego narzędzia do wykrywania treści generowanych przez AI (19 mln użytkowników, 30 mln USD ARR). Obie firmy połączą swoje detektory w jeden system sprawdzania autentyczności.
Seedance 2.5 — ByteDance generuje 30 sekund wideo bez sklejania klipów
ByteDance zaprezentowało 23 czerwca Seedance 2.5 — model AI zdolny do generowania pojedynczego klipu wideo do 30 sekund bez post-processingu. Akceptuje do 50 referencyjnych wejść (obrazy, dźwięk) i obsługuje zmiany sceny w jednej generacji.
Google DeepMind inwestuje 75 mln dolarów w A24, by stworzyć AI dla Hollywood
Google DeepMind zainwestował 75 milionów dolarów w kultowe studio indie A24, tworząc wieloletnią współpracę nad narzędziami AI dla filmowców. To pierwsza znana inwestycja Google'a bezpośrednio w duże studio filmowe.
OpenMontage: twój asystent AI staje się studiem produkcji wideo
OpenMontage to open-source'owy agentic system produkcji wideo z 12 pipeline'ami i 52 narzędziami — opisujesz słowami, agent robi resztę: research, skrypt, montaż, kompozycja. Można zacząć bez żadnego klucza API.
Sakana Fugu Ultra: 7-miliardowy model, który zarządza całą armią agentów AI
Japońskie Sakana AI wypuściło 22 czerwca Fugu Ultra — lekki model-orkiestrator (7B), który rozdziela zadania między specjalistycznych agentów AI, osiągając wyniki na poziomie modeli frontierowych w kodowaniu i rozumowaniu.
GPT-5.5-Cyber i OpenAI Daybreak: AI do polowania na podatności w kodzie
22 czerwca OpenAI wypuściło pełną wersję GPT-5.5-Cyber — wyspecjalizowany model osiągający 85,6% na benchmarku CyberGym. W ramach programu Daybreak uruchomiono też 'Patch the Planet': masowe łatanie podatności w otwartym oprogramowaniu.
Noblista John Jumper odchodzi z DeepMind do Anthropic — Nagroda Nobla trafi do AI for Science
19 czerwca 2026 John Jumper — współtwórca AlphaFold, laureat Nagrody Nobla z chemii 2024 — ogłosił przejście z Google DeepMind do Anthropic. Dołącza do programu AI-for-science i wzmacnia laboratoryjne ambicje firmy w naukach przyrodniczych.
GLM-5.2: open-weight model bije GPT-5.5 w kodowaniu za 1/6 ceny
Zhipu AI wypuściło GLM-5.2 na licencji MIT — model osiąga 62,1 na SWE-bench Pro (GPT-5.5: 58,6) i kosztuje w API ok. 6-krotnie mniej. Otwarte wagi umożliwiają self-hosting bez ograniczeń regionalnych.
Kimi K2.7-Code: open-source MoE z biliоnem parametrów zoptymalizowany pod agentowe kodowanie
Moonshot AI wypuściło 12 czerwca 2026 r. model Kimi K2.7-Code: Mixture-of-Experts z bilionem parametrów (32 mld aktywnych), kontekstem 256K i 30% niższym zużyciem tokenów myślenia niż poprzednik. Wagi open-source na Hugging Face, kompatybilny z vLLM i SGLang.
Claude Code Week 24: sub-agenci mogą teraz tworzyć własne sub-agenty
W tygodniu 8–12 czerwca 2026 r. (wersje v2.1.166–v2.1.176) Claude Code otrzymał kluczową aktualizację: sub-agenci mogą teraz tworzyć własne sub-agenty — do 5 poziomów zagnieżdżenia. Doszło też polecenie /cd oraz konfiguracja fallbackModel.
Cohere North Mini Code 1.0 — 30B w licencji Apache 2.0, jeden GPU H100
Cohere opublikowało 11 czerwca North Mini Code 1.0 — otwarty (Apache 2.0) model MoE o 30 mld parametrach skupiony na zadaniach agentowych i inżynierii oprogramowania. Osiąga 80,2% na SWE-Bench Verified i mieści się na jednym GPU H100. Dostępny też w Ollama.
Gemini 3.5 Live Translate: naturalne tłumaczenie rozmów w czasie rzeczywistym, 70+ języków
9 czerwca 2026 r. Google zaprezentowało Gemini 3.5 Live Translate — model do ciągłego tłumaczenia mowy w czasie rzeczywistym na ponad 70 językach, z opóźnieniem rzędu 2 sekund, bez potrzeby specjalnego sprzętu. Działa na zwykłym smartfonie.
Claude Fable 5: Anthropic udostępnia publicznie swój najmocniejszy model
9 czerwca 2026 Anthropic udostępniło Claude Fable 5 — model przewyższający Opus 4.8 we wszystkich głównych benchmarkach. Kontekst 1M tokenów, najwyższy wynik na FrontierCode, cena 10 USD/M tokenów wejścia.
CVE-2026-42271: krytyczna luka RCE w LiteLLM trafi do CISA KEV
W popularnej bramce AI LiteLLM odkryto podatność command injection w endpointach MCP (CVSS 8.7), którą można łączyć z obejściem uwierzytelnienia — efekt: nieuwierzytelnione RCE. CISA wpisała CVE-2026-42271 do katalogu aktywnie eksploatowanych luk.
NVIDIA Nemotron 3 Ultra — 550 mld parametrów open-weight dla agentów
NVIDIA udostępniło 4 czerwca największy open-weight model z amerykańskiego laboratorium: Nemotron 3 Ultra o 550 mld parametrach (55 mld aktywnych). Hybrydowa architektura Mamba-Transformer osiąga 300+ tokenów/s i trafia na Hugging Face z pełną transparentnością danych treningowych.
Gemma 4 12B: multimodalny model Google DeepMind mieści się w 8 GB VRAM
Google DeepMind udostępniło Gemma 4 12B — pierwszy model z rodziny Gemma obsługujący tekst, obraz, dźwięk i wideo. Działa już przy 6,6 GB VRAM i uruchamia się jedną komendą w Ollama.
JetBrains wydaje Mellum2 — otwartoźródłowy model 12B MoE dla programistów
JetBrains opublikowało Mellum2 na licencji Apache 2.0 — model Mixture-of-Experts (12 mld parametrów, 2,5 mld aktywnych), wytrenowany na ponad 10,6 bln tokenów kodu, do szybkich, wyspecjalizowanych zadań w pipeline'ach AI.
MiniMax M3 — open-weight z milionem tokenów kontekstu i 59% na SWE-Bench Pro
Chiński MiniMax opublikował 1 czerwca flagowy model M3 z kontekstem miliona tokenów, natywną multimodalnością i wynikiem 59% na SWE-Bench Pro. Wagi są dostępne na Hugging Face. Nowy mechanizm uwagi redukuje koszty obliczeniowe do 1/20 standardowej uwagi przy pełnym kontekście.
Brak wyników. Spróbuj innych słów.