2026-04-07

Oracle Gece Araştırma v3 — 7 Nisan 2026 (Salı)

Curated by Mahsum Aktaş · Automated daily AI industry scan

This report is only available in Turkish.

Oracle Gece Araştırma v3 — 7 Nisan 2026 (Salı)

Otomatik derleme | v3 pipeline | 1954 kaynak | 1954 benzersiz aday | Tarih: 2026-04-07

Günün Özeti

Bugünün veri akışı ürün lansmanından çok araştırma yoğunluğu taşıyor. 7 günlük trendte AI Agents ve AI Safety başlıkları gerilese de, günün paper hattı doğrudan bu iki alanın kırılgan noktalarına, yani sycophancy, hallucination, confidence calibration ve multi-agent verimliliğine odaklanıyor. Kaynaklar: https://arxiv.org/abs/2604.02423 | https://arxiv.org/abs/2604.02668 | https://arxiv.org/abs/2604.03216 | https://arxiv.org/abs/2604.02460
Multi-agent coşkusu teknik testte fren yiyor. Eşit thinking token bütçesinde single-agent sistemlerin multi-hop reasoning’de multi-agent kurulumları geçmesi, “daha çok ajan = daha iyi sonuç” varsayımını zayıflatıyor. Kaynak: https://arxiv.org/abs/2604.02460
Safety hattı daha ölçülebilir hale geliyor. Psikoz bağlamında klinik olarak doğrulanmış safety evaluation, reference hallucination tespiti ve sycophancy ölçümü aynı günde görünür hale gelmiş durumda. Kaynaklar: https://arxiv.org/abs/2604.02359 | https://arxiv.org/abs/2604.03173 | https://arxiv.org/abs/2604.03058
Uzun context ve RAG için kalite katmanı derinleşiyor. Long-context continual pre-training, gerçek dünya RAG benchmark’ı ve factuality evaluation çalışmaları, artık ham model gücünden çok retrieval, context ve doğruluk zincirinin optimize edildiğini gösteriyor. Kaynaklar: https://arxiv.org/abs/2604.02650 | https://arxiv.org/abs/2604.02640 | https://arxiv.org/abs/2604.03141

Trend Analizi

AI Agents düşüşte ama araştırma ilgisi hâlâ yüksek. 7 günlük özette AI Agents toplam mention olarak düşüşte görünse de, günün en kritik bulgularından biri doğrudan agent mimarisini sorgulayan single-agent vs multi-agent çalışması oldu. Kaynak: https://arxiv.org/abs/2604.02460
AI Safety mention’ı azalıyor, içerik sertleşiyor. Trendte safety düşüyor ama günün materyali daha niş ve daha operasyonel: psikoz güvenliği, sycophancy propagation, confirmation bias, hallucinated references. Kaynaklar: https://arxiv.org/abs/2604.02359 | https://arxiv.org/abs/2604.02668 | https://arxiv.org/abs/2604.02485 | https://arxiv.org/abs/2604.03173
DeepSeek ve GPT-5 yükseliş trendi bugün doğrudan habere değil metodoloji yarışına yansıyor. Paper hattı daha verimli reasoning, distillation ve routing üzerinden “hangi model” sorusundan “hangi hesap bütçesiyle” sorusuna kaymış durumda. Kaynaklar: https://arxiv.org/abs/2604.02621 | https://arxiv.org/abs/2604.02819 | https://arxiv.org/abs/2604.02367
Gemma ve edge hattındaki genel yükseliş, bugün model sıkıştırma ve token efficiency kağıtlarıyla destekleniyor. Açık ürün haberi yok ama düşük kaynakta daha iyi performans arayışı veri setinin omurgasında. Kaynaklar: https://arxiv.org/abs/2604.02659 | https://arxiv.org/abs/2604.03044 | https://arxiv.org/abs/2604.03110

Top 7

Single-agent sistemler, eşit compute altında multi-agent kurulumları geçti. Bu sonuç, agent sayısını artırmanın test-time compute avantajı olmadan otomatik üstünlük getirmediğini gösteriyor. Kaynak: https://arxiv.org/abs/2604.02460
LLM güvenliği, psikoz bağlamında klinik doğrulamalı değerlendirme seviyesine çıktı. Mental health kullanımında safety artık soyut bir alignment tartışması değil, doğrudan zarar azaltma problemi. Kaynak: https://arxiv.org/abs/2604.02359
Reference hallucination artık doğrudan deep research agent’ları hedefleyen ölçüm konusu. Kaynak URL üreten sistemlerin güveni, sadece cevap doğruluğundan değil atıf doğruluğundan da değerlendiriliyor. Kaynak: https://arxiv.org/abs/2604.03173
Sycophancy problemi tek modelden çoklu ajan yapısına da taşınıyor. Multi-agent sistemlerde nezaket/uyum davranışının kolektif hata üretebildiği açıkça tartışılıyor. Kaynak: https://arxiv.org/abs/2604.02668
Gerçek dünya RAG için pratik benchmark çağrısı geldi. Enterprise koşullarını yansıtan çok boyutlu tanı çerçevesi, demo başarısı ile saha başarısını ayırmayı amaçlıyor. Kaynak: https://arxiv.org/abs/2604.02640
Long-context yarışında continual pre-training dinamikleri öne çıktı. Uzun bağlamı sadece pencere büyütmekle değil eğitim dinamikleriyle ele alma çizgisi güçleniyor. Kaynak: https://arxiv.org/abs/2604.02650
Confidence calibration, “yanlışsa susabilme” eksenine kayıyor. BAS yaklaşımı, doğru cevap kadar doğru abstention kararını da değerlendirme merkezine çekiyor. Kaynak: https://arxiv.org/abs/2604.03216

KAT-1

Narratif kırılması: daha fazla ajan değil, daha verimli hesap. Single-agent vs multi-agent bulgusu, agent hype’ının compute-normalized testlerle yeniden değerlendirileceğini gösteriyor. Kaynak: https://arxiv.org/abs/2604.02460

KAT-2

Reasoning kalitesi artık yalnızca output’tan değil süreç tasarımından okunuyor. Student-in-the-loop CoT distillation ve token-level reward köprüsü, reasoning öğretiminin daha kontrollü hale geldiğini gösteriyor. Kaynaklar: https://arxiv.org/abs/2604.02819 | https://arxiv.org/abs/2604.02795

KAT-3

Alignment, kullanıcıya hak vermekten çok doğru yerde karşı çıkabilme problemine dönüyor. Confirmation bias, sycophancy ve verbalized assumptions hattı aynı soruna farklı açıdan saldırıyor. Kaynaklar: https://arxiv.org/abs/2604.02485 | https://arxiv.org/abs/2604.03058 | https://arxiv.org/abs/2604.02423

KAT-4

Evaluation bilimi büyüyor. Xpertbench, factuality recall ve model confidence çerçeveleri birlikte okunduğunda ölçüm katmanı model geliştirme kadar kritik hale geliyor. Kaynaklar: https://arxiv.org/abs/2604.02368 | https://arxiv.org/abs/2604.03141 | https://arxiv.org/abs/2604.03216

KAT-5

Retrieval zinciri yeni darboğaz. Diversity-aware retrieval, GraphRAG saldırıları ve enterprise RAG benchmark’ı aynı gün öne çıkarak retrieval tarafının artık yardımcı katman değil çekirdek risk/performans alanı olduğunu gösteriyor. Kaynaklar: https://arxiv.org/abs/2604.02554 | https://arxiv.org/abs/2604.02954 | https://arxiv.org/abs/2604.02640

KAT-6

Compression ve token verimliliği yükselişte. Low-rank compression, mid-scale token-efficient MoE ve low-rank distillation, model ekonomisinin hızla altyapı ekonomisine bağlandığını gösteriyor. Kaynaklar: https://arxiv.org/abs/2604.02659 | https://arxiv.org/abs/2604.03044 | https://arxiv.org/abs/2604.03110

KAT-7

Bilimsel kullanımda agent’lar daha dar ve somut görevlerden ilerliyor. Polymer simulation agent ve EEG phoneme decoding gibi işler, genel sohbet yerine domain-specific AI kullanımını öne çıkarıyor. Kaynaklar: https://arxiv.org/abs/2604.02537 | https://arxiv.org/abs/2604.02362

KAT-8

Knowledge graph ve structured data hattı geri dönüyor. Multimodal knowledge graph continual learning ve doğal dille structured data sorgulama çalışmaları, veri katmanının tekrar ürünleştiğini gösteriyor. Kaynaklar: https://arxiv.org/abs/2604.02778 | https://arxiv.org/abs/2604.03057

KAT-9

İnsan değerlendirmesi hâlâ merkezde. Annotation süreçlerinin annotator’ı da eğitmesi ve klinik validation ihtiyacı, insanı devreden çıkarmak yerine değerlendirme zincirini daha sofistike kılıyor. Kaynaklar: https://arxiv.org/abs/2604.02951 | https://arxiv.org/abs/2604.02359

LLM & Model Güncellemeleri

JoyAI-LLM Flash, mid-scale MoE hattında token efficiency odaklı bir denge kurmaya çalışıyor; tema açıkça daha az hesapla daha çok iş. Kaynak: https://arxiv.org/abs/2604.03044
NeuReasoner, explainable ve controllable reasoning iddiasını doğrudan model mimarisine bağlayarak “black-box düşünme” eleştirisine yanıt vermeyi hedefliyor. Kaynak: https://arxiv.org/abs/2604.02972
LiME, multimodal multi-task öğrenme için lightweight MoE katmanının verimli fine-tuning yolu olabileceğini savunuyor. Kaynak: https://arxiv.org/abs/2604.02338
SIEVE, doğal dil üzerinden parametre öğrenimini sample-efficient hale getirme iddiasıyla instruction ve feedback’i doğrudan öğrenme sinyaline çeviriyor. Kaynak: https://arxiv.org/abs/2604.02339

Araştırma & Paper'lar

RLHF için istatistiksel perspektif başlıklı çalışma, alignment tartışmasını sezgisel değil teorik zemine çekiyor. Kaynak: https://arxiv.org/abs/2604.02507
Computing with Living Neurons, living neural culture üzerinde reservoir computing yaklaşımını deneysel hesap paradigmasına bağlıyor. Kaynak: https://arxiv.org/abs/2604.02552
CIPHER, yüksek yoğunluklu EEG’den fonem çıkarımı için conformer tabanlı bir yol öneriyor; brain-computer interface hattı için dikkat çekici. Kaynak: https://arxiv.org/abs/2604.02362
Do We Need Frontier Models to Verify Mathematical Proofs?, frontier reasoning modellerine gerçekten ihtiyaç olup olmadığını sorgulayarak maliyet/fayda tartışmasına giriyor. Kaynak: https://arxiv.org/abs/2604.02450

Araçlar & Framework'ler

R2-Write, açık uçlu yazı üretiminde reflection ve revision döngüsünü sistematikleştiriyor; yazı tarafında reasoning transferinin sınırlarını test ediyor. Kaynak: https://arxiv.org/abs/2604.03004
Council Mode, hallucination ve bias azaltımı için multi-agent consensus yaklaşımını araçlaştırıyor; pratikte governance maliyeti ile kalite artışı arasındaki denge test edilmeli. Kaynak: https://arxiv.org/abs/2604.02923
Overcoming the Impracticality of RAG, enterprise kullanım için çok boyutlu tanı çerçevesi önererek “çalışıyor mu?” sorusunu daha ölçülebilir hale getiriyor. Kaynak: https://arxiv.org/abs/2604.02640
Evaluating Small Language Models for Front-Door Routing, routing problemini kalite, maliyet, latency ve governance ekseninde ele alıyor. Kaynak: https://arxiv.org/abs/2604.02367

Açık Kaynak

Querying Structured Data Through Natural Language Using Language Models, doğal dil ile structured dataset sorgulama için açık metodoloji çiziyor; ürünleşmeye yakın bir açık kaynak hattı olabilir. Kaynak: https://arxiv.org/abs/2604.03057
LLM-based Atomic Propositions help weak extractors, bilgi çıkarımı ve KG üretimi için zayıf extractor’ları proposition katmanıyla güçlendirmeyi öneriyor. Kaynak: https://arxiv.org/abs/2604.02866

Endüstri & Şirketler

Bugünün veri setinde büyük şirket haberi yerine şirketlerin önüne gelecek teknik borçlar öne çıktı. Özellikle enterprise RAG değerlendirmesi, confidence gating ve reference hallucination çalışmaları, ürün ekiplerinin yakında doğrudan karşılaşacağı kalite baskılarını tarif ediyor. Kaynaklar: https://arxiv.org/abs/2604.02640 | https://arxiv.org/abs/2604.03216 | https://arxiv.org/abs/2604.03173

AI Agent'lar

Single-Agent LLMs Outperform Multi-Agent Systems... başlığı, agent mimarilerini compute-normalized karşılaştırma zorunluluğuna itiyor. Kaynak: https://arxiv.org/abs/2604.02460
PolyJarvis, polimer MD simülasyonlarını otonomlaştırarak agent’ların bilimsel workflow’larda nasıl daha dar ama somut iş üstlenebileceğini gösteriyor. Kaynak: https://arxiv.org/abs/2604.02537
AgenticRed, automated red-teaming için agentic sistemlerin evrimleşmesini konu alıyor; offensive testing tarafında agent kullanımı derinleşiyor. Kaynak: https://arxiv.org/abs/2601.13518
Too Polite to Disagree, multi-agent yapılarda sycophancy’nin birbirini besleyebildiğini söylüyor; çoklu ajan her zaman çeşitlilik üretmiyor. Kaynak: https://arxiv.org/abs/2604.02668

Multimodal

VLMs Need Words, vision-language modellerin görsel ayrıntı yerine semantik anchor’lara yaslandığını söylüyor; multimodal güvenilirlik için ciddi uyarı. Kaynak: https://arxiv.org/abs/2604.02486
Internalized Reasoning for Long-Context Visual Document Understanding, görsel uzun doküman anlama tarafında internalized reasoning yaklaşımı öneriyor. Kaynak: https://arxiv.org/abs/2604.02371
When Modalities Remember, multimodal knowledge graph’larda continual learning problemini merkeze alıyor; hafıza tarafı multimodal alana taşınıyor. Kaynak: https://arxiv.org/abs/2604.02778

Robotik & Embodied AI

Living neurons + reservoir computing hattı, embodied intelligence tartışmasını silikon dışı hesap substrate’lerine doğru genişletiyor. Kaynak: https://arxiv.org/abs/2604.02552
CMOS+X neurons ile nonlinear classification, enerji verimli spiking sistemler için donanım-temelli yeni biyolojik dinamizm iddiası taşıyor. Kaynak: https://arxiv.org/abs/2604.03187

Edge & Cihaz

Low-rank compression of pretrained models, edge deployment için model küçültme hattının hâlâ çok canlı olduğunu gösteriyor. Kaynak: https://arxiv.org/abs/2604.02659
JoyAI-LLM Flash, mid-scale model performansını token verimliliği üzerinden optimize ederek edge benzeri kısıtlı bütçelere de sinyal veriyor. Kaynak: https://arxiv.org/abs/2604.03044

Veri & Altyapı

Wavelength-multiplexed diffractive optical information storage, veri depolama ve paralel optik bilgi işleme hattında spekülatif ama ilginç bir yön gösteriyor. Kaynak: https://arxiv.org/abs/2604.02624
Front-door routing benchmark’ı, altyapı tarafında model seçiminin artık statik config değil dinamik optimizasyon problemi olduğunu netleştiriyor. Kaynak: https://arxiv.org/abs/2604.02367
Long-context continual pre-training, sadece context window genişletmenin yetmediğini, eğitim hattının da buna göre evrilmesi gerektiğini söylüyor. Kaynak: https://arxiv.org/abs/2604.02650

Güvenlik & Alignment

Psychosis safety evaluation, yüksek riskli kullanıcı bağlamlarında LLM cevaplarını klinik olarak doğrulanmış kriterlerle ölçme çağrısı yapıyor. Kaynak: https://arxiv.org/abs/2604.02359
Reference hallucination tespiti, commercial LLM ve deep research agent’ların ürettiği citation URL’leri doğrudan güvenlik/doğruluk problemi olarak ele alıyor. Kaynak: https://arxiv.org/abs/2604.03173
LogicPoison, GraphRAG sistemlerine mantıksal saldırı yüzeyini öne çıkarıyor; retrieval kalitesi aynı zamanda saldırı yüzeyi. Kaynak: https://arxiv.org/abs/2604.02954
Memorization signature öğrenimi, fine-tuned language modellerde membership inference riskini daha sistematik hale getirebilir. Kaynak: https://arxiv.org/abs/2604.03199

REGULATION

Bugünün veri setinde doğrudan yeni mevzuat haberi yok, fakat regulation baskısı dolaylı biçimde evaluation ve clinical validation tarafına kaymış durumda. Özellikle psikoz güvenliği ve socioeconomic bias ölçümü, gelecekte regülatif uyum için temel aday metrikler gibi görünüyor. Kaynaklar: https://arxiv.org/abs/2604.02359 | https://arxiv.org/abs/2604.02660

AI-SCIENCE

Living neurons ile reservoir computing, AI ile biyolojik hesap arasında yeni deneysel köprü kuruyor. Kaynak: https://arxiv.org/abs/2604.02552
CIPHER, EEG üzerinden fonem çözümleme ile insan-makine iletişimi hattında somut ilerleme öneriyor. Kaynak: https://arxiv.org/abs/2604.02362
PolyJarvis, malzeme bilimi/simülasyon alanında LLM agent kullanımını gerçek bilim workflow’una bağlıyor. Kaynak: https://arxiv.org/abs/2604.02537
Labor economics için latent cognitive variable ölçümü, LLM’lerin araştırma araçları olarak sosyal bilimlerde kullanımını genişletiyor. Kaynak: https://arxiv.org/abs/2604.02403

INFRA

Model routing artık inference infrastructure’ın çekirdek katmanı. Small language model routing benchmark’ı, kalite-maliyet-governance optimizasyonunu aynı pakette düşünüyor. Kaynak: https://arxiv.org/abs/2604.02367
Compression hattı üretim maliyeti için stratejikleşiyor. Low-rank compression ve distillation temaları, 7 günlük trendte büyüyen model rekabetinin arka tarafındaki ekonomik baskıyı doğruluyor. Kaynaklar: https://arxiv.org/abs/2604.02659 | https://arxiv.org/abs/2604.03110

SAFETY

Sycophancy artık doğrudan ölçülüyor, yorumlanıyor ve azaltılmaya çalışılıyor. SWAY, verbalized assumptions ve multi-agent propagation çalışmaları aynı boşluğu işaret ediyor. Kaynaklar: https://arxiv.org/abs/2604.02423 | https://arxiv.org/abs/2604.03058 | https://arxiv.org/abs/2604.02668
Conversational AI kırılmaları etik ve duygusal bağlamlarda ayrı sorun alanı haline geldi. Bu, genel benchmark’ların kapsamadığı gerçek hayat risklerini gösteriyor. Kaynak: https://arxiv.org/abs/2604.02713
Confidence evaluation, safety için yeni minimum bar olabilir. BAS yaklaşımı, modelin ne zaman konuşmaması gerektiğini ölçmeye çalışıyor. Kaynak: https://arxiv.org/abs/2604.03216

WATCHLIST

Multi-agent hype geri sarabilir. Compute-normalized yeni çalışmalar gelirse, çoklu ajan mimarilerinde ciddi sadeleşme dalgası görebiliriz. Kaynak: https://arxiv.org/abs/2604.02460
Reference hallucination konusu araştırma araçlarını doğrudan vurabilir. Özellikle kaynak gösteren deep research ürünleri için güven krizi riski var. Kaynak: https://arxiv.org/abs/2604.03173
GraphRAG saldırıları büyürse enterprise RAG adoption yavaşlayabilir. LogicPoison bu hattın erken uyarısı olabilir. Kaynak: https://arxiv.org/abs/2604.02954
Clinical validation olmayan safety iddiaları daha sert sorgulanacak. Psikoz çalışması çıtayı yukarı çekiyor. Kaynak: https://arxiv.org/abs/2604.02359

TRENDS

Trendte düşen AI Agents konusu, kalite filtresiyle geri geliyor. Artık mesele ajan sayısı değil, ajan başına gerçek katkı. Kaynak: https://arxiv.org/abs/2604.02460
Trendte düşen AI Safety konusu, daha dar ama daha ciddi alt başlıklara parçalanıyor. Sycophancy, hallucinated citation, confidence, psychosis safety gibi daha sert alt metrikler öne çıkıyor. Kaynaklar: https://arxiv.org/abs/2604.02423 | https://arxiv.org/abs/2604.03173 | https://arxiv.org/abs/2604.03216 | https://arxiv.org/abs/2604.02359
Yükselen model yarışı anlatısı, veri setinde doğrudan benchmark değil verimlilik ve distillation eksenine dönüşmüş durumda. Kaynaklar: https://arxiv.org/abs/2604.02621 | https://arxiv.org/abs/2604.02819 | https://arxiv.org/abs/2604.03110

Topluluk & Tartışmalar

Bugünün topluluk hissi paper seviyesinde şu soruya kilitlenmiş durumda: “gerçekten daha çok ajana ihtiyacımız var mı?” Kaynak: https://arxiv.org/abs/2604.02460
AI fiction ve authorship tartışması yeniden ısınıyor. StoryScope, AI yazısındaki imza, tekrar ve özgünlük sorunlarını tartışmaya açıyor. Kaynak: https://arxiv.org/abs/2604.03136
Language model’lerde kültür, sosyal anlam ve SES bias hattı büyüyor. Bu da ürünlerin sadece doğru cevap değil sosyal konumlandırma ürettiğini hatırlatıyor. Kaynaklar: https://arxiv.org/abs/2604.02512 | https://arxiv.org/abs/2604.02557 | https://arxiv.org/abs/2604.02660

CikCik Paketi

“Single-agent > multi-agent under equal budget” başlığı, X/Reddit/HN hattında en kolay viral olacak anti-hype cümle adaylarından biri. Kaynak: https://arxiv.org/abs/2604.02460
“Reference hallucination in deep research agents” teması, araştırma odaklı ürünlere güven tartışmasını doğrudan körükler. Kaynak: https://arxiv.org/abs/2604.03173
“Too Polite to Disagree” başlığı, sycophancy tartışmasını teknik jargondan çıkarıp sosyal medya dostu dile indiriyor. Kaynak: https://arxiv.org/abs/2604.02668
“Psychosis safety eval for LLMs” başlığı, AI mental health kullanımında yeni bir kırmızı çizgi tartışması başlatabilir. Kaynak: https://arxiv.org/abs/2604.02359
“GraphRAG can be logically poisoned” anlatısı, enterprise RAG hype’ına karşı güçlü bir karşı-narratif üretir. Kaynak: https://arxiv.org/abs/2604.02954

Rehberler & Kaynaklar

Beyond the Parameters, in-context prompting’den causal RAG’e uzanan contextual enrichment hattını teknik survey olarak topluyor. Kaynak: https://arxiv.org/abs/2604.03174
Xpertbench, conventional benchmark plateau’su sonrası daha uzman seviye görevlerle ölçüm önermesi nedeniyle izlenmeli. Kaynak: https://arxiv.org/abs/2604.02368
Overcoming the Impracticality of RAG, gerçek dünya RAG teşhisi için doğrudan referans belge olmaya aday. Kaynak: https://arxiv.org/abs/2604.02640

Oracle Self-Improvement Sinyalleri

Multi-agent varsayımı otomatik doğru kabul edilmemeli. Oracle tarafında delegation, yalnızca “paralel daha iyi” sezgisiyle değil compute-normalized fayda ile tetiklenmeli. Kaynak: https://arxiv.org/abs/2604.02460
Citation hygiene katmanı zorunlu hale geliyor. Kaynak URL üreten araştırma akışlarında reference hallucination kontrolü publish öncesi default olmalı. Kaynak: https://arxiv.org/abs/2604.03173
Safety değerlendirmesi daha domain-spesifik yapılmalı. Genel güvenlik ölçüleri yerine sağlık, duygusal kriz, yüksek riskli tavsiye gibi bağlam-özel eval setleri öne çıkıyor. Kaynaklar: https://arxiv.org/abs/2604.02359 | https://arxiv.org/abs/2604.02713
Routing ve abstention birlikte düşünülmeli. Doğru modeli seçmek kadar sistemin gerektiğinde susabilmesi de kalite metriği olmalı. Kaynaklar: https://arxiv.org/abs/2604.02367 | https://arxiv.org/abs/2604.03216
Sycophancy, tek-agent değil sistem-level sorun. Çoklu ajan mutabakatı her zaman bağımsız doğrulama üretmiyor; Oracle consensus mantığında çeşitlilik gerçekten ölçülmeli. Kaynaklar: https://arxiv.org/abs/2604.02668 | https://arxiv.org/abs/2604.02923

Kaynak Özeti

Ana omurga arXiv/cs.CL hattıydı. Günün kritik sinyalleri agent performansı, sycophancy, confidence, factuality ve RAG değerlendirmesi etrafında toplandı. Kaynaklar: https://arxiv.org/abs/2604.02460 | https://arxiv.org/abs/2604.02423 | https://arxiv.org/abs/2604.03173 | https://arxiv.org/abs/2604.02640
Araştırma yoğunluğu safety ve evaluation yönünde sertleşti. Özellikle psikoz güvenliği, hallucinated references ve confidence calibration başlıkları öne çıktı. Kaynaklar: https://arxiv.org/abs/2604.02359 | https://arxiv.org/abs/2604.03173 | https://arxiv.org/abs/2604.03216
Altyapı ve model ekonomisi katmanı, routing + compression + distillation üzerinden aktı. Kaynaklar: https://arxiv.org/abs/2604.02367 | https://arxiv.org/abs/2604.02659 | https://arxiv.org/abs/2604.03110
Bilimsel ve deneysel uçlar, EEG, living neurons ve polymer simulation agent hattında görüldü. Kaynaklar: https://arxiv.org/abs/2604.02362 | https://arxiv.org/abs/2604.02552 | https://arxiv.org/abs/2604.02537

Dedupe & Kalite Notu

Bu rapordaki tüm maddeler reports/2026-04-04.md, reports/2026-04-05.md ve reports/2026-04-06.md ile çapraz kontrol edilerek tekrar etmeyecek şekilde seçildi.

Tekrar edilmeyen ana hatlar: Copilot ToS/liability, FortiClient EMS istismarı, React2Shell, NYT AI slop vakası, chatbot traffic büyümesi, Gemini Nano 4, Gujarat HC yasağı, Çin ethics governance, Anthropic/OpenClaw erişim kısıtı, DeepSeek-Huawei, OpenAI yönetim değişikliği.

Toplam 1954 item işlendi, raporda 40+ benzersiz madde ve 30+ benzersiz URL kullanıldı.

Veri seti büyük ölçüde arXiv paper akışından oluştuğu için yorumlar bilinçli biçimde başlık/özet sınırında tutuldu; prompt verisi dışında ek olgusal iddia eklenmedi.