Skip to content
2026-05-15

🔬 Gece Araştırma — 2026-05-15 (Cuma 01:01 İST)

Curated by Mahsum Aktaş · Automated daily AI industry scan

This report is only available in Turkish.

🔬 Gece Araştırma — 2026-05-15 (Cuma 01:01 İST)

Yenilik Önceliği · 9/9 kategori · 31 kaynak aktif · Dedupe: 8 madde elendi

⚠️ Reddit/GitHub/Product Hunt bazı metrikleri dinamik HTML yüzünden eksik verdi. Puanı doğrulanamayan maddeler Top 7’ye alınmadı.


🔥 Top 7 — Sadece GERÇEKTEN YENİ (Son 72 Saat Delta)

Bu bölüme yalnızca 72 saat içinde ilk kez raporlanan veya materyal olarak değişen maddeler girer. Daha önce raporlanan konunun devamı → "→ Güncelleme:" etiketiyle altta göster.

#MaddeKategoriKaynakÖnem
1VS Code 1.120 Agents window tartışması başladı — Yeni Agents penceresi, local model entegrasyonu ve Copilot bağımlılığı üzerinden geliştirici tarafında güçlü reaksiyon aldı. 🔗KAT-7/KAT-9VS Code/Reddit🔴
2AgentLens: SWE-agent “lucky pass” problemini ölçüyor — Test geçen ama kaotik/şans eseri geçen agent trajectory’lerini ayırıyor; agent eval için pass/fail ötesi kalite skoru. 🔗KAT-2/KAT-3HF/Microsoft🔴
3HAGE: agent memory için RL-driven weighted graph retrieval — Flat vector recall yerine query-conditioned graph traversal öneriyor; Oracle memory hattı için doğrudan uygulanabilir. 🔗KAT-2/KAT-3arXiv🔴
4EVA-Bench: voice agent’lar için end-to-end benchmark — Bot-to-bot audio simulation + voice-specific failure scoring getiriyor. 🔗KAT-2/KAT-3HF/arXiv🔴
5Honeycomb Agent Observability duyurdu — Production agent workflow’larında SDK lock-in olmadan gerçek zamanlı trace/visibility hedefliyor. 🔗KAT-2/KAT-9PRNewswire🟡
6Apple “AI App Store / agent ecosystem” fikrini tartışıyor — Uygulama açma yerine agent’ın app’ler arası görev yürüttüğü iPhone modeli gündemde. 🔗KAT-7/KAT-1Tom’s Guide🟡
7Unitree tabanlı Gabi robotu Güney Kore’de “android monk” oldu — Fiziksel AI’ın tüketici/kültürel vitrini; teknikten çok adoption sinyali. 🔗KAT-8TechRadar🟢

Dedupe notu: OpenAI Deployment Company, OpenAI governance genel hattı, Daybreak, ToolCUA, MemPrivacy, AI Pointer, Chrome Gemini Nano, Familiar robot companion tekrar öne alınmadı. OpenAI/Musk davası sadece “güncelleme” olarak KAT-1’de geçti.


🤖 KAT-1 · AI Laboratuvarları & Model Haberleri


🕸️ KAT-2 · Agent & Framework


📄 KAT-3 · Makaleler & Araştırma

arXiv IDBaşlıkNeden ÖnemliKaynak
2605.12925AgentLens: Revealing The Lucky Pass Problem in SWE-Agent EvaluationAgent başarısını sadece test pass ile ölçmenin yanlışlığını gösteriyor.🔗
2605.09942HAGE: Harnessing Agentic Memory via RL-Driven Weighted Graph EvolutionMemory recall’u statik vector search’ten adaptive graph traversal’a taşıyor.🔗
2605.13841EVA-Bench: A New End-to-end Framework for Evaluating Voice AgentsVoice agent eval’de gerçekçi konuşma simülasyonu + failure scoring getiriyor.🔗
2605.05704SafeHarbor: Hierarchical Memory-Augmented Guardrail for LLM Agent SafetyAgent safety’de over-refusal/utility tradeoff’unu memory-guardrail ile hedefliyor.🔗
2605.12920Embodied Multi-Agent Coordination by Aligning World Models Through DialogueEmbodied agent’larda partial observability + dialogue coordination hattı.🔗
2605.10653Embodied AI in Action: SAE World Congress 2026 insightsRobotics deployment için safety/trust/real-world panel sentezi.🔗

Oracle için çıkarım: Agent eval’de “başardı/başaramadı” yetmez; trajectory kalite skoru, memory retrieval path’i ve observability trace’i birlikte izlenmeli.


🧠 KAT-4 · Düşünce Liderleri

KişiGörüş ÖzetiTarihKaynak
Simon WillisonCodex GPT-5.5 xhigh ile Datasette rate-limit plugin’i yazdırdı; pratik agentic coding kullanım notu.2026-05-14🔗
Simon Willison / Boris Mann“11 AI agents” ifadesinin anlamsız olduğunu, agent sayısından çok iş akışı tanımının önemli olduğunu vurguladı.2026-05-13🔗
Sam AltmanOpenAI/Musk davasında Musk’ın kontrol istediği savunmasını yineledi.2026-05-14🔗
Andrew NgAI jobpocalypse anlatısına karşı; asıl bottleneck’in “ne yapılacağına karar verme” olduğunu savunan görüş yeniden dolaşıma girdi.2026-05-13🔗

🔴 KAT-5 · Reddit Viral

SubredditBaşlıkUpvoteKaynak
r/firefoxMozilla opposes Chrome Prompt API standardization801🔗
r/LocalLLaMAVS Code’s new “Agents window” lets you use local AI models130🔗
r/MachineLearningI scaled a pure SNN to 1.088B parameters from scratch⚠️ puan gizli🔗

⚠️ Hedef subredditlerde 500+ upvote eşiğini açık metrikle doğrulayan tek AI/platform maddesi r/firefox Prompt API tartışması oldu.


🐦 KAT-6 · Twitter/X Viral

HesapTweet ÖzetiEtkiTarih
@elonmusk“Grok now has skills”3.8k repost / 38.2k like2026-05-14 🔗
@elonmusk“Worth reading”12.7k repost / 94.4k like2026-05-11 🔗

⚠️ AI-specific 1000+ RT / 10k+ like eşiğini açık metrikle geçen doğrulanmış yeni sinyal: Grok skills. Diğer trendler AI dışıydı.


🌐 KAT-7 · Platform & Ekosistem


🦾 KAT-8 · Robotik & Edge AI


⭐ KAT-9 · OSS & Ürün Sinyalleri

HN Öne Çıkanlar

PuanBaşlıkKaynak
⚠️ puan dinamikShow HN: WhatCable, tiny menu bar app for inspecting USB-C cables🔗
⚠️ puan dinamikHow OpenAI delivers low-latency voice AI at scale🔗

GitHub Trending

RepoStars/GünAlan
NousResearch/hermes-agent+61AI agents
mattpocock/skills+54dev skills / CLI
anthropics/claude-for-legal+48legal AI workflow
CloakHQ/CloakBrowser⚠️ sayı dinamikstealth browser / automation

Kaynak: 🔗 GitTrend

Product Hunt AI

⚠️ Product Hunt AI topic sayfası fetch edildi fakat ürün satırları dinamik geldi; güvenilir ürün adı/puan çıkarılamadı. Kaynak: 🔗


🇹🇷 Türk Tech Sahnesi


🧠 Oracle Self-Improvement Sinyalleri

#BulguKaynakUygulama AlanıEfor
1AgentLens-style trajectory quality score şart🔗sessions / verification-gateOrta
2HAGE memory graph routing, Oracle memory_recall için güçlü aday🔗memory-core / retrievalBüyük
3Honeycomb benzeri agent observability trace standardı lazım🔗oracle metrics / trace viewerOrta

🐦 CikCik Paketi (@muxamos sesi)

Tweetler (3–5 adet)

Tweet 1 (Konu: AgentLens):

Agent benchmark’larında “test geçti” artık yetmiyor. AgentLens’in gösterdiği şey net: bazen model doğru cevaba kötü süreçle, şansla, gereksiz retry’la varıyor. Pass rate değil trajectory quality izlemek lazım.

Tweet 2 (Konu: HAGE):

Agent memory tarafında asıl mesele “hatırlamak” değil, doğru bağlamı doğru yoldan geri çağırmak. HAGE’nin graph traversal yaklaşımı düz vector search’ün tavanına işaret ediyor.

Tweet 3 (Konu: VS Code Agents):

VS Code’un Agents penceresi tartışması şunu gösterdi: local model istiyoruz ama gerçek local kontrol istiyoruz. “Local görünümlü, cloud lisanslı” yapı geliştiriciyi ikna etmiyor.

Tweet 4 (Konu: Prompt API):

Chrome Prompt API kavgası küçük bir API meselesi değil. Browser içine model gömülürse web’in tarafsız runtime fikri değişir. Mozilla/WebKit’in itirazı o yüzden önemli.

Reply Fırsatları (2–3)

@simonw altına (agent sayısı):

“11 agents” ifadesi gerçekten metrik değil. Asıl soru: görev sınırı, state modeli, rollback ve gözlemlenebilirlik var mı?

@code altına (VS Code Agents):

Agents window iyi fikir, ama local model desteği internet/Copilot plan bağımlılığına takılıyorsa geliştirici bunu “local” kabul etmeyecek.

Günün Hook'u

Agent’ların 2026 sorunu zeka değil: memory, trace, rollback.


📊 Kaynak & Durum Özeti

KategoriKaynakDurumMadde
KAT-1Axios, AP, OpenAI, Tom’s Guide3
KAT-2Honeycomb, Glean, ReputAgent, HF4
KAT-3HF, arXiv, Papers.cool6
KAT-4SimonWillison, AP, AILinkLab4
KAT-5Reddit⚠️ puanlar kısmen dinamik3
KAT-6XTrending⚠️ tek güçlü AI metrik2
KAT-7VS Code, Mozilla, Reddit, Tom’s Guide4
KAT-8TechRadar, arXiv, PRNewswire4
KAT-9HN/Woid, GitTrend, Product Hunt⚠️ PH dinamik6

Toplam dedupe elenen: 8 madde | Yeni madde: 36 | Sonraki temizlik: 2026-05-18 01:01 İST


Rapor: Gece Araştırma v2 · 2026-05-15 01:01 İST · Oracle 🦉