Baştan Aşağı Değişim: Intel Lunar Lake Mimarisi Neler Sunuyor?

Devlerin kapışması devam ediyor. 2024 yılının ikinci yarısı CPU dünyasında önemli yeniliklere ev sahipliği yapacak. AMD, Ryzen AI 300 mobil işlemcileriyle birlikte hibrit mimariye geçiş yaparken aynı zamanda yapay zeka alanında ciddi atılımlar yapmıştı. Intel ise Intel Tech Tour 2024 sırasında Lunar Lake mimarisini açıklayarak rakibine yanıt verdi. Yeni mimari, ilk olarak Core Ultra 200V mobil işlemcilerde kullanılacak.

Aslına bakarsanız Intel’in rakibi sadece AMD değil, Apple ve Qualcomm ile de rekabet söz konusu. Her şeyin farkında olan şirket köklü değişiklikler yapma kararı almış. Lunar Lake ile işlemcilerin tasarımı a’dan z’ye değişiyor. Bu arada küçük bir not düşelim, Lunar Lake mimarisi mobil platforma, dizüstü bilgisayarlara yönelik. Ancak temel tasarım değişikliklerinin çoğunu muhtemelen masaüstü Arrow Lake tarafında da göreceğiz. Başka bir deyişle, yakında piyasaya çıkacak olan masaüstü Intel CPU’lar da ciddi yeniliklerle gelecek.

Detayları sergilenen mimari, paket üzerinde bellek (memory-on-package, MoP) teknolojileri de dahil olmak üzere gelişmiş bağlantı ve paketleme teknolojileriyle desteklenmekte. Intel Core Ultra 200V Lunar Lake artık bir CPU değil, her şeyiyle bir SoC’e (system on a chip) tasarımı olmuş. Tasarımda ayrıca bir sistem belleği de bulunmayacak. Yeni işlemciler 32 GB’a kadar uzanan kapasitelerde LPDDR5X bellekle birlikte geliyor.

Intel, yeni tasarımlarını hem genel kullanım, hem de Microsoft Copilot+ gibi yeni nesil AI PC platformlarına hitap edecek şekilde tasarlamış. Performanstan ödün vermeyen çipler hem oldukça verimli, hem de yapay zeka iş yüklerinde çok başarılı. Özetleyecek olursak, Lunar Lake ile yüksek çekirdek performansı, çığır açan x86 güç verimliliği, yüksek yapay zeka hesaplama performansı ve gelişmiş grafik performansı sağlanıyor.

Core Ultra 200V serisi Apple M3, Qualcomm Snapdragon X Elite ve Ryzen AI 300 gibi serilerle mücadele edecek. İlk başta Lunar Lake mimarili en az iki model piyasaya sürülecek, ancak bu modellerin nihai özellikleri sunumda paylaşılmadı. Yapay zekaya odaklanan teknoloji devi, yıl sonuna kadar 40 milyon yapay zeka özellikli işlemci sevk etmeyi planlıyor ve Lunar Lake yongaları halihazırda şirketin fabrikalarında bulunuyor. Çipler 2024’ün 3. çeyreğinde sevkiyat sistemlerine ulaşacak.

Intel bildiğiniz gibi yıllardır farklı çekirdek türlerine sahip hibrit işlemciler üretiyor. Hibritin arkasındaki fikir, işlemcinin yazılım işleme yüklerine daha iyi yanıt verebilmesi için farklı güç tüketim değerleri sunan CPU çekirdekleri geliştirmekti. P-Core dediğimiz performans çekirdekleri yoğun ve ağır iş yükleriyle ilgilenirken, E-Core dediğimiz verimlilik çekirdekleri ise düşük öncelikli ve hafif iş yüklerini yürütmek üzere tasarlandı. Şirket aynı zamanda CPU’nun işletim sistemiyle daha iyi iletişim kurabilmesi için Thread Director adı verilen donanımsal çözüm üzerinde çalıştı. Thread Director, iş yüküne bağlı olarak doğru çekirdeklerin çalışmasını sağlamak için geliştirilen bir donanımsal bileşen.

Lunar Lake ile Intel, SoC’in dört temel bileşeninin tümünün mikro mimarisini güncelledi: CPU işlem kompleksi iki yeni nesil CPU çekirdeği sunuyor; entegre grafikler (iGPU) yeni bir grafik mimarisiyle geliyor; ve NPU, Copilot+ AI PC gereksinimlerini karşılamak için hem güncellendi hem de güçlendirildi. Bunların yanı sıra Intel’in silikon üzerinde yaptığı birçok güncelleme var. Paket üzerinde bellek tasarımına geçiş yapıldı ve bu radikal bir karar oldu. Tıpkı Apple M3 ve Qualcomm Snapdragon X Elite gibi çiplerde olduğu gibi.

Lunar Lake mimarisinin her bileşeni, Intel’in x86 bilgisayarlardan beklentilerimizi yeniden tanımlayacağını söylediği rafine bir güç ve performans karışımı için optimize edildi. En büyük gelişim şüphesiz verimlilik çekirdeklerinde. Skymont mimarisine geçişle birlikte %38 ve %68 oranında IPC kazançları yaşandı. Lion Cove mimarisi ise performans çekirdeklerine %14’lük IPC kazancı getirdi. Grafikler, yeni Xe2 entegre grafik motoru ile iGPU performansında %50’lik bir iyileşme sağladı.

Artık yapay zekaya ayrı bir parantez açmadan olmuyor. Mobil işlemciler, yapay zeka iş yükleri için 48 TOPS performans sunan yeni nöral işlem birimi (NPU) ile birlikte sunulacak. Böylelikle Microsoft’un yeni nesil yapay zeka bilgisayarlar için şart koştuğu 40 TOPS NPU gereksinimi kolaylıkla karşılanmış oldu. Hatırlarsanız AMD, XDNA 2 mimarisi ve Ryzen AI 300 serisiyle 50 TOPS NPU performansı sunuyordu. Intel ise sadece NPU hesaba katıldıysa neredeyse rakibiyle denk. Ancak Lunar Lake platformu çok daha fazla AI performansına sahip: CPU ve iGPU’yu hesaba kattığımızda toplamda 120 TOPS seviyesinde performans vaat edilmiş.

Lunar Lake mobil yongalar, birinci dereceden öncelik olarak güç verimliliğini sağlamaya odaklanan tamamen yeni bir tasarım metodolojisi kullanıyor ve bu temel mimari, Intel’in Arrow Lake ve Panther Lake gibi gelecekteki ürünleri için yapı taşı olarak benimsenecek. Bu yeni tasarım odağı, şirketin dizüstü bilgisayar pazarında AMD, Apple ve Qualcomm güçlü rakiplerle mücade etmesinde anahtar rol oynayacak.

Şaşırtıcı bir şekilde Intel, CPU, GPU ve NPU’yu barındıran bilgi işlem kalıbı için yönünü TSMC’ye çevirdi, 3nm (N3B) işlem teknolojilerini kullandı. Ayrıca harici I/O arayüzlerini barındıran kontrolcü platform kalıbı için yine TSMC’nin 6nm (N6) teknolojisini kullanmışlar. Çip üzerinde Intel tarafından üretilen tek silikon ise yonga kalıpları ve ana sistem arasındaki iletişimi kolaylaştıran pasif 22FFL Foveros temel sistem yongası.

Intel, çipleri tasarlamaya başladıklarında TSMC çözümlerinin mevcuttaki en seçenek olduğunu söylüyor. Yani demek istiyorlar ki başka seçenek yoktu. Mavi devin dört yıl içinde beş ayrı işlem teknolojisi aracılığıyla dökümhane tarafındaki liderliğini yeniden kazanma gibi bir hedefi vardı.

1 – 6

TSMC tarafında yapılan seçim de hedeflerdeki yaşanan gecikmeyi bir kez daha kanıtladı. Bununla birlikte Intel, mimarileri diğer işlem süreçlerine kolayca taşınacak şekilde tasarladı. Nitekim şirket, gelecekteki ürünleri için aynı mimarileri kendi dökümhanelerinde de kullanabilecek. Lunar Lake’in yeni mikro mimarileri, şirketin masaüstü için yakında duyuracağı Arrow Lake işlemcilerinin ve hatta Xeon 6 serisinin de önünü açıyor. Şimdi ayrıntılara geçelim.

Core Ultra 200V serisinde yer alan modeller henüz açıklanmadı. En üst düzey işlemci 4 P-Core ve 4 E-Core ile birlikte gelecek. Çip iki mantık kalıbı, bir TSMC N3B hesaplama kalıbı, bir N6 platform kontrolcü kalıbı ve 22FFL temel Foveros kalıbından meydana geliyor. Tüm bunların üstünde bir de işlevsel olmayan bir dolgu silikon parçası mevcut.

Intel, gecikme süresiyle birlikte PCB alanını azaltmak ve bellek PHY’sinin güç tüketimini %40’a kadar düşürmek için 16 GB veya 32 GB konfigürasyonlarda iki LPDDR5X-8500 bellek yığınını doğrudan yonga paketine yerleştiriyor. Bellek dört adet 16 bit kanal üzerinden iletişim kuracak ve çip başına 8,5 GT/s’ye kadar verim sağlayacak.

Hesaplama birimi CPU performans ve verimlilik çekirdeklerini, Xe2 GPU’yu ve NPU 4.0 isimli yapay zeka çipini içinde barındırıyor. Ayrıca isabet oranlarını artırmak ve veri hareketini azaltmak, böylece güç tasarrufu sağlamak için tüm çeşitli hesaplama birimleri arasında paylaşılabilen yeni 8 MB ‘yan önbellek’ entegre edilmiş. Ancak tüm birimler arasında paylaşıldığı için bu önbellek teknik olarak L4 önbellek tanımına uymuyor.

Intel ayrıca güç dağıtım alt sistemini çipten karta taşımış ve birden fazla güç rayı ve daha fazla kontrol sağlamak için anakarta dört PMIC yaymış. Genel olarak Intel, Meteor Lake’e kıyasla SoC gücünde %40’lık bir azalma olduğunu iddia ediyor.

P-Core: Lion Cove Performans Çekirdekleri

Lunar Lake’in performans çekirdekleri, masaya IPC’de (Döngü Başına Talimat) ortalama %14’lük bir kazanç getiriyor. Ancak Intel, Hyper-Threading (çoklu iş parçacığı) ve bu performans artırıcı özelliği sağlayan tüm mantık bloklarını kaldırarak çekirdekleri hibrit bir mimari için optimize ederken beklenmedik bir dönüş yaptı.

Intel’in mühendisleri, yoğun iş parçacıklı iş yüklerinde IPC’yi ~%30 oranında artıran Hyper-Threading teknolojisinin hibrit tasarımda o kadar da önemli olmadığı sonucuna vardı. İş parçacıkları genellikle önce çekirdeklerdeki ekstra iş parçacıklarından yararlanmadan önce P-Core’lara programlanıyordu, ardından ek iş parçacıkları E-Core’lara yönlendiriliyordu. E çekirdekleri doygunluğa ulaştıktan sonra ek iş parçacıkları P-Core’da bulunan ekstra iş parçacıklarına planlanmaya başlandı.

Hyper-Threading için gereken özel mekanizmaların ve ekstra güvenlik özelliklerinin kaldırılması, çekirdeği daha yalın hale getirerek performans verimliliğinde %15, alan başına performansta %10 ve alan başına güç başına performansta %30 artış sağladı. Bu, kontrol devresini mevcut bırakırken yalnızca Hyper-Threading’i devre dışı bırakmaktan çok daha etkili oldu. Yeni yaklaşım ayrıca daha fazla E-Core veya GPU çekirdeği gibi diğer bileşenler için kalıp alanını koruyor.

Ancak Intel, Hyper-Threading’i tamamen bir kenara bırakmıyor; bu teknoloji yalnızca bazı P-Core tasarımlarında kullanılacak. Şirket, Lion Cove çekirdeğinin biri hiper iş parçacıklı diğeri hiper iş parçacıklı olmayan iki versiyonunu tasarladı. Böylece iş parçacıklı Lion Cove çekirdeği, yakında çıkacak olan Xeon 6 işlemcilerde gördüğümüz gibi diğer uygulamalarda da kullanılabilecek.

Lion Cove ayrıca farklı termal ve güç eşikleri için voltaj/frekans eğrisinde belirli noktalar atamak gibi çeşitli çalışma koşulları için önceden tanımlanmış statik ayarlardan bir geçişi de işaret ediyor. Artık daha akıllı bir şekilde dinamik olarak adapte olmak için bir AI otomatik ayarlama kontrolcüsü kullanılmakta. Intel’in saat frekansları da daha önce yalnızca 100 MHz’lik artışlarla ayarlanabiliyordu. Şimdi daha ince ayrıntılı frekans ve güç kontrolü sağlamak için 16,67 MHz’lik dilimlerle ayarlanabiliyor. Teknoloji devi, bunu bazı senaryolarda güç verimliliğinde veya performansta tek haneli yüzdelik artışlarla ilişkilendiriyor ve her bit, verimlilik odaklı bir mimaride önemli.

Intel, doğruluğu korurken tahmin bloğunu önceki mimariye göre 8 kat genişlettiğini söylüyor. Bunun yanında, komut önbelleğinden L2’ye olan istek bant genişliği üç katına ve komut getirme bant genişliği saniyede 64’ten 128 bayta çıkarıldı. Ek olarak, kod çözme bant genişliği döngü başına 6’dan 8 talimata çıkarılırken, mikro-op önbelleği okuma bant genişliği ile birlikte artırıldı. Mikro-op kuyruğu da 144 girdiden 192 girdiye yükseldi.

Önceki P-Core mimarilerinde talimatları yürütme portları arasında dağıtmak için tek bir zamanlayıcı vardı, ancak tasarım donanım ek yüküne ve ölçeklenebilirlik sorunlarına neden oluyordu. Bu sorunları ele almak isteyen Intel, esnekliği artırmak amacıyla sıra dışı motoru bağımsız yeniden adlandırıcılar ve zamanlayıcılarla tamsayı ve vektör alanlarına ayırdı. Ayrıca retirement, komut penceresi ve yürütme portlarının yanı sıra tamsayı ve vektör yürütme işlem hatlarında da bir dizi iyileştirme yapıldı.

1 – 9

Bellek alt sistemi yeni bir L0 önbellek seviyesine sahip. Mühendisler, mevcut L1 ve L2 önbellekleri arasına 192KB’lik bir katman eklemek için veri önbelleğini tamamen yeniden tasarladılar. Nihayetinde L1 tipindeki önbellek L0 olarak yeniden adlandırıldı. Önbellek tasarımındaki değişimlerle IPC’yi artıran ortalama yük-kullanım süresini azaltıldı ve artan kapasite nedeniyle gecikmeden ödün vermeden L2 önbellek kapasitesinin artırılması sağlandı. Sonuç olarak, L2 önbellek Lunar Lake’te 2,5 MB’a ve Arrow Lake’te 3 MB’a kadar çıkabilecek. Her iki mimari de Lion Cove mimarili P-Core’lar kullanacak.

Çip üreticisi ayrıca tescilli tasarım araçlarını kullanmaktan, kullanımı için optimize edilmiş endüstri standardı araçlara geçti. Intel’in eski mimarileri, elle çizilmiş devrelerden oluşan on binlerce hücrelik “Fubs” (işlevsel bloklar) ile tasarlanırdı. Şimdi ise yüz binlerce ve hatta milyonlarca hücreden oluşan büyük, sentezlenmiş bölümler kullanılabiliyor. Yapay sınırların kaldırılması tasarım süresini ve süreci iyileştirirken alanın daha verimli kullanılmasını sağlıyor.

Bu aynı zamanda özelleştirilmiş SoC’e özgü tasarımları daha hızlı bir şekilde ortaya çıkarmak için tasarıma daha fazla yapılandırma seçeneği eklenmesini sağladı. Intel, süreçteki değişimin Lunar Lake ve Arrow Lake için kullanılan çekirdekler arasında daha fazla özelleştirmeye izin verdiğini söylüyor. Bu tasarım metodolojisi sayesinde aynı zamanda tasarımın %99’u diğer işlem teknolojilerine aktarılabiliyor, başka bir deyişle uyarlanabiliyor. Yani Intel, gelecekte TSMC’nin teknolojileri yerine kendi dökümhanelerini kullanabilecek.

Değişikliklerin sonucu olarak Meteor Lake’te kullanılan önceki nesil Redwood Cove mimarisine göre sabit saat hızıyla IPC’de %14’lük bir artış sağlanmış. CPU üreticisi ayrıca çipin çalışma gücüne bağlı olarak Meteor Lake’e göre %10 ile %18 arasında değişen genel performans iyileştirmelerine de işaret ediyor. Güç/performans iyileştirmeleri projeksiyonlara/tahminlere dayanmakta, bu nedenle Intel ‘güçteki performans’ tablosundaki ölçümler için kendisine +/- %10 hata payı vermiş.

E-Core: Skymont Verimlilik Çekirdekleri

Lion Cove çekirdek mimarisinde sayısız değişimden bahsettik. Ancak Skymont, tamsayı iş yüklerinde %38 IPC iyileştirmesi ve kayan nokta işlerinde %68 IPC kazanımı ile önceki nesle göre daha da büyük bir ilerleme kaydetmiş görünüyor. Meteor Lake çiplerde yer alan düşük profilli E-Core’lara kıyasla tek iş parçacıklı performansta 2 kata kadar artış ve çok iş parçacıklı iş yüklerinde 4 kata kadar daha yüksek performans sağlandı. Intel ayrıca vektörleştirilmiş AVX ve VNNI iş yüklerinde de verimi iki katına çıkardı.

Skymont, Alder Lake’teki Gracemont ve Meteor Lake’teki Crestmont’un ardından x86 Intel hibrit işlemciler için tasarlanan üçüncü E-Core çekirdek tasarımı oldu. Bir önceki Meteor Lake tasarımında, aşırı düşük güç gerektiren iş yükleri için SoC kalıbına yerleştirilmiş 2 LP E-Core ve CPU birimine P-Core’lar ile birlikte yerleştirilen 4 ek E-Core görmüştük. Lunar Lake ile işleyişi değiştiren Intel, hem düşük güçlü E-Core hem de yüksek güçlü E-Core rollerini genişletilmiş bir dinamik aralıkla ele almak için işlem biriminde tek bir dört çekirdekli küme kullanıyor.

Mavi ekip, kod çözme motorunu beslemek için 96 komut baytlık bir paralel getirme ekleyerek dal tahmin motorunu optimize etti. Kod çözme kümelerindeki genişlik düzeyi 6’dan (2×3, Crestmont) 9’a (3×3, Skymont) yükseltildi. Böylece yeni tasarımdaki herhangi bir çekirdek saat başına dokuz komut kod çözme sürecini sürdürebilecek. Skymont ayrıca artık üç kod çözme kümesinin daha sık paralel olarak çalışmasını sağlamak üzere paralel mikro kod üretimini mümkün kılmak için nanokod kullanmakta. Mikro-op kapasitesi de ön uç ve arka uç arasında daha fazla tamponlama eklemek için 64’ten 96 girişe çıkarıldı.

Bununla birlikte, duraklamalardan sonra kaynakları mümkün olduğunca çabuk boşaltmak için Crestmont’un 8 genişlikli retire işlemi iki katına, yani 16’ya genişledi. Böylelikle güç ve alan verimliliği arttı. “The out of order window” önceki nesle göre %60 daha büyük. Bu terimler oldukça yabancı, ancak mimaride daha büyük kayıt dosyaları, daha derin rezervasyon istasyonları ve daha derin yükleme ve depolama tamponlaması sağlandığını belirtelim. Paralellik, sekiz ALU, üç atlama portu ve üç yükleme/çevrim desteği dahil olmak üzere 26 gönderim portu kullanılarak artırıldı.

Intel, Skymont ile iki adet 128-bit FP ve SIMD vektör hattından dörde çıkarak vektör performansında 2 kat iyileşme hedefliyor. Vektör motorunda gecikme süresi azaltıldı ve kayan nokta yuvarlama desteği de eklendi.

1 – 13

Önceki verimlilik çekirdeklerinin yer aldığı kümelerde paylaşılan 2 MB L2 önbellek vardı, bu miktar iki kat artarak 4 MB’a çıktı. Dahası, L1’den L1’e aktarım bant genişliği de iyileştirildi.

Tek iş parçacıklı tamsayı ve kayan nokta performansında sağlanan %38 ve %68’lik iyileşme gerçekten etkileyici. Ancak bu karşılaştırma özellikle Meteor Lake SoC’deki düşük güçlü (LP) E-Core’lar ile yapılmış; CPU biriminde P-Core’lar ile birlikte yer alan standart E-Core’lar ile değil. Şirket yaptığı kıyaslamalarda +/-%10 gibi büyük oranlı hata payları olabileceğini söylüyor.

Skymont’un güç ve tek iş parçacıklı performans eğrisi Crestmont’a göre büyük ölçüde geliştirilmiş, ancak karşılaştırmalar aynı şekilde LP tipindeki çekirdeklere karşı yapılmış. Crestmont’un en yüksek performansıyla karşılaştırıldığında, Skymont aynı seviyede performans sunmak için üçte bir oranında güç tüketiyor. Bununla beraber aynı güç seviyesinde 1,7 kat daha fazla performans sağlanabiliyor. Genel olarak, Skymont’un en yüksek tek iş parçacıklı performansı Crestmont LP E-çekirdeklerinin iki katı.

Skymont’un 4 çekirdekli kümesi yine benzer 4 çekirdekli kümeyle karşılaştırılmamış, bunun yerine Meteor Lake’in çift çekirdekli düşük güçlü E-çekirdekli kümesiyle karşılaştırılmış. Bu nedenle bahsettiğimiz büyük yüzdeli oranlara fazla takılmayın.

Intel ayrıca Skymont ile Raptor Lake’in Raptor Cove mimarisini kullanan performans çekirdekleri için de karşılaştırmalar yaptı. Yani ilginç şekilde performans ve verimlilik çekirdekleri kıyaslandı. Bu noktada Skymont’un tamsayı ve kayan nokta performansında %2’lik bir avantajı olduğu belirtiliyor. Ancak yine yüksek oranlı hata payı olabileceği söylenmiş.

Grafik Performansında Sıçrama: Lunar Lake Xe2 GPU

Yeni Xe2 entegre GPU, Meteor Lake’in Arc Grafikleri’ne kıyasla 1,5 kata kadar daha fazla grafik performansı ve 67 TOPS’a kadar yapay zeka performansı sunuyor. Intel ayrıyeten GPU mimarisinin isimlendirmesini de basitleştirdi: Önceki nesil Xe mimarisinde kullanılan Xe-LP, Xe-HP ve Xe-HPG son eklerinin aksine tüm yapılandırmalarda sadece Xe2 adı yer alacak.

Intel’in Xe2 mimarisi yalnızca Lunar Lake işlemcilerde değil, aynı zamanda yakında çıkacak olan Battlemage oyun GPU’larında da kullanılacak. Elbette harici ve dahili GPU aynı olmayacak. Temelde mimari aynı olsa da, Lunar Lake daha düşük güçlü transistörler kullanırken Battlemage performansı en üst düzeye çıkarmak için daha hızlı transistörler kullanacak. Yaklaşan Intel ekran kartları için performans tahminlerinde bulunmak isterdik, ancak her şey farklı olacağından dolayı bir tahmin yürütmek kolay değil. Harici ekran kartları tasarımdan belleklere kadar her konuda farklı.

Xe2 GPU mimarisi Intel’in ikinci nesil Xe çekirdeklerini, daha fazla veri türünü destekleyen daha büyük XMX motorlarını, gelişmiş vektör motorlarını, daha büyük ışın izleme birimlerini ve daha derin önbellekleri içeriyor. GPU, geometri işleme, doku örnekleme ve rasterleştirme gibi görevler için sabit işlevli grafik donanımının yanı sıra ikinci nesil Xe çekirdeklerine ve render dilimlerine ayrılmış. Bu birimler büyük bir önbellek ve bellek yapısının yanı sıra uygulamaya bağlı olarak değişen G/Ç donanımlarına bağlı. Tasarım doğası gereği modüler, yani daha fazla veya daha az birim kullanılacak şekilde kolayca ölçeklendirilebiliyor.

İkinci nesil Xe çekirdeği, XVE vektör motorlarında saat başına sekiz adet 512-bit çarpma ve XMX motorlarında saat başına sekiz adet 2048-bit vektör yapabilecek. Intel ayrıca SIMD motorunu 8 şerit genişliğinden 16 şerit genişliğine çıkarmış, bu da uyumluluğu artıracak daha yaygın bir düzenleme. Ek olarak çekirdeğin 192 KB paylaşımlı L1 önbellek kullandığını belirtelim.

1 – 7

İkinci nesil vektör motoru, yapay zeka işlemleri için INT2, INT4, INT8, FP16 ve BF16 komutlarını desteklemekte. Intel’in sunduğu slayt görsellerinde yüksek TOPS değerlerini gösteren hesaplamaları görebilirsiniz.

Grafik işleme birimi de irili ufaklı birçok iyileştirme aldı; işlem hattı boyunca köşe dağılımını değiştirerek 3 kat vertex getirme verim artışı, vertex yeniden kullanımı yoluyla örgü gölgeleme performansının üç katına çıkarılması, sıra dışı örnekleme için yeni destek ve filtreleme olmadan örnekleme için iki kat daha fazla verim gibi. Şirket ayrıca yeni Xe Işın İzleme Birimi’nde (RTU) yeniden düzenlenen işlem hattı sayesinde ışın izleme performansının arttığını belirtiyor.

Yapay Zeka: NPU 4.0

Yapay zeka stratejisinin merkezi bileşeni olan NPU, daha önce de bahsettiğimiz gibi 48 TOPS performans seviyesine çıktı. Bununla birlikte, NPU öncelikle düşük yoğunluklu işler için tasarlandı, böylece muazzam miktarda pil gücü tasarrufu sağlayabiliyor. GPU, 67 TOPS performansla daha zorlu iş yükleri için devreye girecek. CPU ise 5 TOPS gibi daha küçük miktarlarla yapay zeka iş yüklerine katkıda bulunabilecek. Böylelikle bir Lunar Lake SoC, toplamda 120 TOPS yapay zeka performansı sunabilecek.

Buradaki en büyük hikaye, Lunar Lake’e güç veren NPU 4’ün Meteor Lake’te bulunan NPU 3’ten 4 kat daha fazla yapay zeka çıkarım performansına sahip olması. Yapay zeka çıkarım performansı Meteor Lake’te 12 TOPS iken Lunar Lake’te 48 TOPS’a sıçradı. Bu miktar, Copilot+’ın yerel oturumlarını hızlandırmak ve Copilot+ AI PC sertifikasına hak kazanmak için Microsoft tarafından belirlenen 40 TOPS gereksinimini karşılıyor ve rahatlıkla aşıyor.

Yapay zeka çıkarım performansındaki bu doğrusal ölçeklendirme sadece mimari iyileştirmelerden (NPU’nun güç ayak izini azaltmaya çalışan) değil, aynı zamanda NCE (nöral hesaplama motoru) sayılarından da kaynaklı. Meteor Lake mimarisindeki 2 olan NCE miktarı Lunar Lake ile 6’ya çıkarıldı. Orantılı olarak RAM, DMA bant genişliği ve L2 önbelleği de gelişim gösterdi.

Yapay zeka birimi matris çarpma ve evrişim (MAC) dizisi, INT8 ve FP16 veri türlerini 2048 MAC/devir INT8 veya 1024 MAC/devir FP16 ile desteklemekte. Intel, aktivasyon fonksiyonlarındaki iyileştirmeler, veri dönüşümü, SHAVE DSP’deki yükseltmeler ve DMA motorunun bant genişliğindeki iki kat artış sayesinde NPU 3’e göre performans/Watt’ta iki kat artış olduğunu iddia ediyor. NPU 4’ün ham vektör performansı şimdi NPU 3’ün 12 katı, AI TOPS’un 4 katı ve NPU’nun dokuya olan bant genişliğinin 2 katı.

Bağlantı

TSMC 6nm süreci üzerine inşa edilen platform I/O birimi tüm SoC arayüzlerine ve platform bağlantılarını üzerinde taşıyor. İlginç bir şekilde, işlemcinin bellek kontrolcüleri CPU çekirdeklerini, iGPU’yu ve NPU’yu içeren Hesaplama bölümünde yer almakta. Bu bellek kontrolcüsü yalnızca LPDDR5X’i destekliyor, çünkü yalnızca paket üzerine entegre bellekler kullanılabiliyor.

I/O yongası Wi-Fi 7 + Bluetooth 5.4’e sahip entegre bir WLAN denetleyicisi, 5,8 Gbps WLAN bant genişliği desteği ve üç adede kadar 40 Gbps Thunderbolt 4 bağlantı noktasını destekleyen bir Thunderbolt 4 kontrolcüsü dahil olmak üzere birçok yeni nesil bileşeni bir araya getiriyor. Aynı zamanda PCI-Express kök kompleksi de burada yer alıyor. Lunar Lake yalnızca 8 PCIe şeridi sunuyor; dördü Gen 5 ve diğer dördü Gen 4 olmak üzere.

Sadece 8 PCIe şeridinin arkasındaki fikir, Core Ultra 200V ailesinin hedeflediği cihaz türünden kaynaklanıyor. Yeni nesil çipler ince ve hafif dizüstü bilgisayarlarda kullanılacak, dahası harici bir GPU bulunmayacak. Dört Gen5 şeridi yeni nesil PCIe 5.0 NVMe SSD’leri çalıştıracak, diğer dört Gen4 şeridi ise platform bağlantıları için bırakılacak.

Lunar Lake, 3 adede kadar Thunderbolt 4 40 Gbps bağlantı noktasının yanı sıra 5 Gbps ve 10 Gbps USB 3.2 ile birlikte USB 2.0 bağlantısını desteklemekte. Yine çok fazla bağlantı noktası yok ve bu tür bir cihazda bunlara ihtiyacınız da olmayacak. Gerekirse bir genişletme yuvası veya Thunderbolt tabanlı bir eGPU kullanılabilir.

Thread Director Geliştirmeleri

Özetleyecek olursak, işlemcinin içinde yer alan çekirdeklerle işletim sisteminin daha iyi iletişim kurmasını sağlayan donanım bazlı Thread Director teknolojisi de çeşitli iyileştirmeler kazandı. Güç tüketimi ve performans optimizasyonları yapıldı. Zamanlamalarla birlikte çekirdek seçimi geliştirildi.

1 – 4

Lunar Lake’i kısaca tanımlayacak olursak, mobil SoC alanında doğrudan Meteor Lake ile karşılaştırıldığında Intel’in büyük bir mimari yükseltmesi diyebiliriz. Mavi takımın mühendisleri mimaride neredeyse dokunulmadık yer bırakmamış. Performans çekirdeklerinden verimlilik çekirdeklerine, yapay zeka iş yüklerinden entegre grafik performansına ve bağlantılara kadar her alanda bir değişim söz konusu.

Alder/Raptor Lake	Meteor Lake	Lunar Lake	Arrow Lake	Panther Lake
P-Core Mimarisi	Golden Cove/ Raptor Cove	Redwood Cove	Lion Cove	Lion Cove	Cougar Cove?
E-Core Mimarisi	Gracemont	Crestmont	Skymont	Crestmont?	Darkmont?
GPU Mimarisi	Xe-LP	Xe-LPG	Xe2	Xe2?	?
NPU Mimarisi	–	NPU 3720	NPU 4	?	?
Aktif Çip Bölümleri	1 (Monolitik)	4	2	4?	?
Üretim Teknolojisi	Intel 7	Intel 4 + TSMC N6 + TSMC N5	TSMC N3B + TSMC N6	Intel 20A + diğer	Intel 18A
Segment	Mobil + Masaüstü	Mobil	Düşük Güç Mobil	Yüksek Performans Mobil + Masaüstü	Mobil?
Çıkış Tarihi	4.Ç-2021	4.Ç-2023	3.Ç-2024	4.Ç-2024	2025

Related Posts

Bir yanıt yazın Yanıtı iptal et