İçeriğe atla
2026-05-07

🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)

Curate eden: Mahsum Aktaş · Günlük otomatik AI sektör taraması

🔬 Gece Araştırma — 2026-05-07 (Perşembe 01:01 İST)

Yenilik Önceliği · 9/9 kategori · 36 kaynak aktif · Dedupe: 12 madde elendi

⚠️ KAT-5 Reddit skorları kısmen gizli döndü; doğrudan Reddit URL + üçüncü taraf canlı tarama snapshot’ı kullanıldı.
⚠️ KAT-6 X/Twitter için 1000 RT / 10k like eşiği bağımsız doğrulanamadı; medya tarafından doğrulanan viral tartışmalar işlendi.
⚠️ KAT-9 HN/GitHub/Product Hunt sayfaları açıldı ama bazı puan/repo/ürün listeleri extract edilemedi; ilgili alt bölümlerde işaretlendi.


🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer.
Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#MaddeKategoriKaynakÖnem
1Anthropic, agent’lara “dreaming” tekniği getirdi — ajanların oturumlar arasında geçmiş davranışı gözden geçirip hata azaltması ve hafıza iyileştirmesi hedefleniyor. 🔗KAT-1/KAT-2Business Insider🔴
2Genesis AI, GENE-26.5 robot “brain” duyurdu — insan ölçeğinde dexterous hand + veri motoruyla fiziksel manipülasyon iddiası geldi. 🔗KAT-8PRNewswire🔴
3Apple’ın iOS 27’de üçüncü taraf AI model seçimi hazırladığı iddia edildi — Siri/OS seviyesinde model rekabeti App Store “Extensions” katmanına taşınabilir. 🔗KAT-7Bloomberg aktarımlı ToI🟡
4Anthropic, Claude Code talebi için SpaceX Colossus 1 kapasitesine yöneldi — 300 MW / 220k GPU ölçeği, agent ürünlerinde compute savaşının sertleştiğini gösteriyor. 🔗KAT-1MarketWatch/WSJ🔴
5ARIS HF Daily #1 oldu — cross-model adversarial reviewer + evidence-to-claim audit, otomatik araştırma sistemleri için doğrudan uygulanabilir. 🔗KAT-3/KAT-2Hugging Face🔴
6Chrome 148 stable: Prompt API ve yeni web platform değişiklikleri — on-device Gemini Nano erişimi ve CSS/web API güncellemeleri developer etkisi yaratıyor. 🔗KAT-7Chrome Developers🟡
7→ Güncelleme: GitHub MCP Server secret scanning GA oldu — MCP uyumlu agent/IDE içinde commit öncesi secret tarama üretime çıktı. 🔗KAT-2/KAT-7GitHub Changelog🟡

Dedupe notu: Top 7’den elenen/eskiye düşenler: GPT-5.5 Instant default, CAISI model review, MolmoAct2, Mastra Durable Agents, MCP RCE alarmı, A2A 1.0 baseline, VS Code 1.116/1.117, Chrome 147, Windows 11 May agent taskbar, Familiar robot, Meta ARI acquisition, Product Hunt agent kümesi.


🤖 KAT-1 · AI Laboratuvarları & Model Haberleri


🕸️ KAT-2 · Agent & Framework


📄 KAT-3 · Makaleler & Araştırma

arXiv IDBaşlıkNeden ÖnemliKaynak
2605.03042ARIS: Autonomous Research via Adversarial Multi-Agent CollaborationCross-family reviewer + claim audit, Oracle araştırma motoruna direkt kalıp.HF
2605.04036OpenSeeker-v210.6k SFT trajectory ile search agent SOTA iddiası; pahalı RL hattına alternatif.HF
2605.02396HeavySkillParallel reasoning + summarization’ı harness değil model içi beceri gibi ele alıyor.HF
2605.02801RL for LLM-based Multi-Agent Systems through Orchestration TracesSpawn/delegate/aggregate/stop kararlarını RL credit assignment problemine çeviriyor.HF
2605.03596Workspace-Bench 1.0Büyük dosya bağımlılıklarında agent performans açığını ölçüyor; gerçek workspace testi.HF
2605.03941iWorld-BenchInteractive world model’lar için 330k video / 4.9k test görevi benchmark’ı.HF
2604.28123PRISMMultimodal RL öncesi distribution alignment; SFT→RL drift sorununa çözüm.HF
2605.01371ESARBenchUAV embodied search-and-rescue ajanlarını değerlendiren yeni benchmark.Arxiv Troller

Oracle için çıkarım: ARIS + Workspace-Bench + orchestration traces birlikte kullanılmalı: iddia defteri, kanıt eşleme, workspace bağımlılık testi ve reviewer-agent gate.


🧠 KAT-4 · Düşünce Liderleri

KişiGörüş ÖzetiTarihKaynak
Simon Willison“Vibe coding” ile agentic engineering’in pratikte birbirine yaklaştığını yazdı; outbound agent eylemlerinde human-in-loop vurgusu yaptı.2026-05-06simonwillison.net
Yann LeCunAI iş kıyameti söylemlerinin öğrencilere zarar verdiğini, CEO hype’ına kör güvenilmemesi gerektiğini söyledi.2026-05-05/06Fortune
Sam AltmanGPT-5.5’in kendi launch party planlama davranışını “strange” örnek olarak anlattı; model kişiselleşmesi tartışması büyüdü.2026-05-03/05Business Insider
Dario AmodeiClaude Code kaynaklı büyümenin compute sınırına dayandığını ve adoption’ın mühendislikten başladığını vurguladı.2026-05-06Business Insider

🔴 KAT-5 · Reddit Viral

SubredditBaşlıkUpvoteKaynak
r/sysadminMicrosoft AI Tour sonrası enterprise “agent” yorgunluğu≈670DEV tarama
r/OpenAIIs Codex the best right now?≈495+ / çok yorumReddit
r/codexOpenAI Codex Surpasses Claude Code in Downloads≈393+Reddit
r/LocalLLaMADeepSeek V4 Pro matches GPT-5.2 on FoodTruck Bench≈291Reddit
r/LocalLLaMAQwen3.6-27B + local agentic search SimpleQA iddiası≈428DEV tarama

🐦 KAT-6 · Twitter/X Viral

HesapTweet ÖzetiEtkiTarih
@sama / OpenAI çevresiGPT-5.5 party ve modelin kendi event akışını önermesi X/tech çevresinde viral tartışmaya döndü.Metrik doğrulanamadı; medya “viral tech moment” dedi.2026-05-05/06
Anthropic / Claude Code çevresi“Dreaming”, Managed Agents ve Claude Code büyümesi etrafında agent memory tartışması büyüdü.RT/like eşiği doğrulanamadı.2026-05-06
Boris Cherny / Anthropic“Manual code writing bitti” çizgisi yeniden dolaşıma girdi; software engineering tartışmasını kızıştırdı.Medya yayılımı var, X metrik yok.2026-05-06

⚠️ KAT-6 Kaynak Hatası: X metrikleri CDP/X erişimi olmadan doğrulanamadı. Kullanılan kaynaklar: BI GPT-5.5 party, BI Anthropic dreaming, ToI Boris Cherny


🌐 KAT-7 · Platform & Ekosistem


🦾 KAT-8 · Robotik & Edge AI


⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

PuanBaşlıkKaynak
⚠️ doğrulanamadıOur AI started a cafe in Stockholm — AI manager deneyinde human-in-loop etik tartışmasıSimon/HN linkli not
⚠️ doğrulanamadıAgent/Codex/Claude Code tartışmaları HN ve Reddit’e taşındıHN

GitHub Trending

RepoStars/GünAlan
⚠️ Kaynak extract hatasıGitHub Python daily trending açıldı ama repo satırları alınamadıGitHub Python Trending
⚠️ Kaynak extract hatasıGitHub TypeScript daily trending açıldı ama repo satırları alınamadıGitHub TS Trending
ARIS8.12k toplam yıldızResearch agent harness
OpenSeeker-v2629 toplam yıldızSearch agent training

Product Hunt AI

⚠️ KAT-9 Kaynak Hatası: Product Hunt AI sayfası dinamik içerik nedeniyle ürün listesi döndürmedi. Kaynak denendi: Product Hunt AI


🇹🇷 Türk Tech Sahnesi

Bu dönemde Türkiye bağlantılı özel AI/agent/robotik gelişme tespit edilmedi.

⚠️ Bonus kaynak notu: “Türkiye yapay zeka AI haber 2026-05-07 / technopat AI haber” araması belirgin yeni madde döndürmedi.


🧠 Oracle Self-Improvement Sinyalleri

#BulguKaynakUygulama AlanıEfor
1Cross-model adversarial reviewer + claim ledger araştırma hatalarını azaltır.ARISgece-arastirma / rapor doğrulamaOrta
2MCP secret scanning agent workflow içine alınmalı; commit/cron öncesi secret gate.GitHub MCPscripts / MCP config / governanceKüçük
3Workspace-Bench tarzı büyük dosya bağımlılığı testi Oracle doğrulama suite’ine uyarlanmalı.Workspace-Benchverification-gate / reviewerOrta

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: Anthropic dreaming):

Agent’ların “dreaming” fikri hype gibi duruyor ama asıl mesele basit: sistem oturum bitince ne öğrendiğini düzgün çıkarabiliyor mu? Memory yoksa agent değil, uzun promptlu chatbot.

Tweet 2 (Konu: GitHub MCP secret scanning):

MCP ekosistemi büyüdükçe “tool bağladım çalıştı” dönemi bitiyor. GitHub’ın MCP secret scanning GA hamlesi doğru yön: agent’a yetki vermeden önce sızıntı ve izin sınırı otomatik kontrol edilmeli.

Tweet 3 (Konu: ARIS):

ARIS’in iyi tarafı “AI research yapıyor” demesi değil; evidence-to-claim audit koyması. Agent raporunda asıl problem cevap üretmek değil, iddianın kanıtla gerçekten bağlı kalması.

Tweet 4 (Konu: Chrome 148 Prompt API):

Chrome 148 ile on-device Prompt API stable sinyali önemli. Web tarafında model çağırmak yavaş yavaş “uzak API isteği” olmaktan çıkıp tarayıcı primitive’ine dönüşüyor.

Reply Fırsatları (2–3)

@simonw altına (agent etik):

Katılıyorum. Agent deneyleri gerçek dünyada üçüncü kişilerin zamanını tüketmeye başladığı anda “demo” olmaktan çıkıyor. Outbound action için human-in-loop şart.

@github altına (MCP secret scanning):

MCP için doğru hamle. Bir sonraki adım secret scanning + permission diff + tool manifest review’ı tek preflight gate altında birleştirmek olmalı.

@AnthropicAI altına (dreaming):

“Dreaming” ilginç ama ölçüt kritik: reflection gerçekten hata azaltıyor mu, yoksa sadece daha iyi anlatılmış session summary mi? Benchmark görmek lazım.

Günün Hook'u

Agent savaşında kazanan en zeki model değil; hafızası, kanıt disiplini ve güvenlik sınırı en iyi sistem olacak.


📊 Kaynak & Durum Özeti

KategoriKaynakDurumMadde
KAT-1BI, MarketWatch, ET, TechCrunch4
KAT-2GitHub, BI, VentureBeat, Mistral/VB4
KAT-3Hugging Face Papers, arXiv mirror8
KAT-4Simon Willison, Fortune, BI4
KAT-5Reddit direct, DEV live scans⚠️ skor kısıtlı5
KAT-6BI, ToI, TechTwitter context⚠️ X metrik yok3
KAT-7Chrome Dev, VS Code, GitHub, Apple news5
KAT-8PRNewswire, HF, TechCrunch, Verge5
KAT-9HN, GitHub Trending, Product Hunt⚠️ extract kısıtlı4

Toplam dedupe elenen: 12 madde | Yeni madde: 34 | Sonraki temizlik: 2026-05-08 01:01 İST


Rapor: Gece Araştırma v2 · 2026-05-07 01:01 İST · Oracle 🦉