Bu çevirinin orijinali “Ultra Low-Latency Block Synchronization at High TPS: Consensus Observer (AIP-93)” adlı yazıya buradan ulaşabilirsiniz.
Joshua Lind ve Zekun Li tarafından
Özet: Blok senkronizasyon süresini ve işlem gecikmelerini azaltan yeni bir veri yayma tekniği olan Consensus Observer (CO), artık Aptos Mainnet’te yayında. Blok yayılımını yürütme ve taahhüt sonrasına kadar erteleyen geleneksel durum senkronizasyonunun aksine CO, ağ genelinde anında blok yayılımına olanak tanır. Bu, tam düğümlerin blok verilerini daha erken almasını ve blokları doğrulayıcılarla paralel olarak işlemesini sağlar. CO, uçtan uca işlem gecikmelerini şu şekilde azaltır: (i) düşük yükte (örn. 500 TPS) ~%10; (ii) orta yükte (örn. 5k TPS) ~%30; ve (iii) daha yüksek yüklerde (örn. 10k TPS+) ~%50+.
Bu, Aptos’u mikro ödemeler, akış ve otonom ödemeler gibi ultra düşük gecikmeli kullanım senaryolarıyla gerçek zamanlı bir dijital ekonomiyi desteklemeye bir adım daha yaklaştırıyor.
Durum Senkronizasyonu ile İlgili Sorun
Durum senkronizasyonu, blok zinciri ağları için temel bir zorluktur. Konsensüs algoritmaları doğrulayıcılar arasında anlaşma sağlarken, ağdaki diğer eşler (örn. tam düğümler) için durum senkronizasyonu sorununu çözmez. Bunun yerine doğrulayıcı olmayan eşler arasında blok zinciri verilerini dağıtmak, doğrulamak ve kalıcı hale getirmek için ek protokoller (durum senkronizasyon protokolleri olarak adlandırılır) gereklidir.
Durum senkronizasyon protokolleri verimli, güvenilir ve yüksek performanslı olmalıdır. Bunun nedeni, bir blok zinciri işleminin yaşam döngüsünde önemli bir rol oynamaları ve işlem kapasitesini ve gecikmesini doğrudan etkilemeleridir. Eğer durum senkronizasyonu yavaş veya güvenilmezse, ağ eşleri (örn. tam düğümler) uzun işlem işleme gecikmeleri algılar, bu da işlem kesinleşme süresini yapay olarak şişirir ve kullanıcı deneyimini olumsuz etkiler. Durum senkronizasyonu hakkında daha fazla bilgi için bkz: The Evolution of State Sync.
Şekil 1, Aptos ağ topolojisini şu şekilde göstermektedir: (i) Konsensüsü yürüten doğrulayıcılar; (ii) Doğrulayıcılardan senkronize olan doğrulayıcı tam düğümler (VFN’ler); ve (iii) VFN’lerden senkronize olan genel tam düğümler (PFN’ler).
Şekil 1: Doğrulayıcıları, doğrulayıcı tam düğümleri (VFN’ler) ve genel tam düğümleri (PFN’ler) gösteren Aptos ağ topolojisi.
Durum senkronizasyonu, geleneksel olarak blok verilerini VFN’lere ve PFN’lere yaymadan önce doğrulayıcıların blokları yürütmesini ve taahhüt etmesini bekler. Bu yaklaşım, anlaşılması kolay olsa da, eşlerin blokları mümkün olan en kısa sürede almasını ve işlemesini engellediği için gecikmelere neden olur. Bu, saniyenin altında işlem gecikmelerine ulaşan Aptos için özellikle sorun teşkil eder. Yürütme ve taahhüt için beklenen herhangi bir ek süre (örn. yüksek yükte 100’lerce milisaniye), şunlara neden olabilir: (i) tam düğümlerin doğrulayıcıların gerisinde kalmasına; (ii) uçtan uca işlem gecikmelerinin ani artış göstermesine; ve (iii) boşta geçen süre nedeniyle hesaplama ve ağ kaynaklarının israf olmasına.
Consensus Observer’ın Tanıtımı
Geleneksel durum senkronizasyonunun sınırlamalarını ele almak için Aptos Labs, blok yayılımını yürütme ve taahhütten ayıran yenilikçi bir veri yayma tekniği olan Consensus Observer’ı (CO) önerdi. CO, doğrulayıcıların yerel işlemeyi beklemek zorunda kalmadan blok verilerini diğer ağ eşlerine anında iletmesine olanak tanır. Bu, ağ genelinde senkronizasyon süresini önemli ölçüde azaltır ve şu sonuçları doğurur: (i) eşler blokları daha erken işleyebildiği için daha düşük uçtan uca işlem gecikmeleri; (ii) hesaplama ve ağ kaynakları daha az boşta kaldığı için verimliliğin artması; ve (iii) blok yayılımının daha az operasyonel bağımlılığı olduğu için daha öngörülebilir senkronizasyon süreleri.
Consensus Observer şu sorunun cevabıdır: Tam düğümlerin blok verilerine erişmesini sağlamanın en hızlı yolu nedir, böylece doğrulayıcılarla paralel şekilde işleyebilirler?
Consensus Observer Nasıl Çalışır?
CO, blok yayılımını yürütme ve taahhütten ayırarak ağ eşlerinin (örn. VFN’ler ve PFN’ler) doğrulayıcı blok işleme hattını gözlemlemesine ve blok verisini üretildiği anda işlemesine olanak tanır. Bu, blokların yayılmadan önce tüm işleme hattından geçmesini gerektiren geleneksel durum senkronizasyonunun tersinedir.
Aptos doğrulayıcıları, üç temel aşamadan oluşan çok aşamalı bir blok işleme hattı kullanır (aşağıdaki Şekil 2’ye bakınız):
-
Sıralama Aşaması — İşlemler bloklar halinde toplanır ve konsensüs ile sıralanır.
-
Yürütme Aşaması — Sıralı bloklar doğrulayıcılar tarafından yerel olarak yürütülür.
-
Taahhüt Aşaması — Yürütülen bloklar sonlandırılır ve blok zincirine taahhüt edilir.
Hem sıralama hem de taahhüt aşaması, tek ve tutarlı bir blok zinciri geçmişi sağlamak için (yani blok zinciri çatallanmalarını önlemek için) konsensüs anlaşması gerektirir.
Şekil 2: Tek bir bloğun işlem hattından geçişini gösteren çok aşamalı ve ayrıştırılmış blok işleme hattı.
CO, tam düğümlerin (yani VFN’ler ve PFN’ler) tam blok taahhüdünü beklemek yerine, bu hattın her aşamasını doğrulayıcılarla paralel olarak takip etmesine ve işlemesine olanak tanıyarak senkronizasyonu geliştirir.
-
Blok yayılımı: Bir blok, doğrulayıcılar tarafından önerildiğinde ve sıralandığında, hemen tam düğüm eşleriyle paylaşılır, örn. sıralı blok doğrudan bağlı VFN’lere gönderilir.
-
Paralel işleme: Ardından, doğrulayıcılar ve tam düğümler bloğu aynı anda işler. Bu, bloğun doğrulanmasını, işlemlerin yürütülmesini ve durumun güncellenmesini içerir.
-
Taahhüt onayı: Blok doğrulayıcılar tarafından taahhüt edildiğinde, taahhüt onayı, tıpkı 1. adımda sıralanan bloğun paylaşıldığı gibi tam düğümlerle paylaşılır. Tam düğümler daha sonra veriyi yerel olarak taahhüt ederek tüm düğümler arasında senkronizasyon sağlar.
-
Sürekli senkronizasyon: Bu döngü her yeni blok için tekrarlanır ve ağdaki doğrulayıcılar ile tam düğümler arasında gerçek zamanlı uyumun korunmasını sağlar.
Bu sürece ilişkin daha fazla detay, güvenlik hususları ve tam düğümlerin kötü niyetli doğrulayıcılara ve geçersiz blok verisinden korunmak için kullandığı teknikler de dahil olmak üzere AIP’de bulunabilir.
Consensus Observer’ın Faydaları
Çok aşamalı blok yürütme hattı dikkate alındığında, geleneksel durum senkronizasyonunu CO ile karşılaştırmak kolaylaşır. Örneğin, geleneksel VFN durum senkronizasyonu durumunda, VFN’nin sıralı bir bloğu işlemeye başlamadan önce şu adımların gerçekleşmesini beklemesi gerektiğini göreceksiniz: (i) doğrulayıcı blok yürütmesi; (ii) doğrulayıcı blok taahhüdü; ve (iii) doğrulayıcıdan VFN’ye blok yayılımı. Bu, aşağıdaki Şekil 3’te görülebilir.
Şekil 3: Geleneksel durum senkronizasyonu, blok verisinin VFN’lere yayılmasından önce blokların doğrulayıcılar tarafından tamamen işlenmesini gerektirir.
Bunu, blok verisinin sıralandıktan hemen sonra VFN’lere yayıldığı CO ile karşılaştırdığınızda, iyileştirmeler belirgin hale gelir: doğrulayıcı yürütme ve taahhüt gecikmeleri denklemden çıkarılır. Böylece, VFN’lerin bloğu işlemeye başlamadan önce yalnızca bloğun ağ üzerinden yayılmasını beklemeleri gerekir. Bu, aşağıdaki Şekil 4’te görülebilir.
Şekil 4: Consensus Observer (CO), bloğu yerel olarak yürütmeden ve taahhüt etmeden önce blok verisini bir doğrulayıcıdan bir VFN’ye yayar.
Tek bir sıralı blok için doğrulayıcılar ile VFN’ler arasındaki senkronizasyon süreleri (veya senkronizasyon gecikmesi) karşılaştırıldığında, CO yalnızca VFN’ler için gecikmeyi azaltmakla kalmaz, aynı zamanda daha öngörülebilir bir davranış da sağlar. Bunun nedeni CO’nun blok yayılımını blok işlemeden ayırmasıdır. CO ile VFN’ler genellikle doğrulayıcıların yalnızca tek bir ağ atlaması kadar gerisinde kalır (örn. Aptos Mainnet’te düşük yükte ~50ms). Bu, geleneksel durum senkronizasyonuna kıyasla önemli bir azalmadır; çünkü yüksek yükte yürütme ve taahhüt, 100’lerce milisaniye gecikme ekleyebilir.
Ayrıca, ağ yükü arttıkça (örn. saniye başına işlem sayısı), CO VFN’lerde öngörülebilir bir senkronizasyon gecikmesini koruyabilirken, geleneksel durum senkronizasyonu daha yüksek işlem süreleri nedeniyle artan gecikmeler ve varyans yaşar.
Son olarak, CO’nun faydaları PFN senkronizasyon gecikmesi açısından katlanarak artar. Örneğin, geleneksel durum senkronizasyonunda PFN’ler VFN’lerden senkronize olur ve bu nedenle hem doğrulayıcının hem de VFN’nin bloğu tamamen işlemesini beklemek zorunda kalır. Ancak CO ile VFN’ler, blok verisini işlemeden önce PFN’lere yayar; bu da PFN’lerin VFN’lerden yalnızca bir ağ atlaması kadar geride kaldığı anlamına gelir (yukarıdaki gibi). Bu, geleneksel durum senkronizasyonunda ortaya çıkan birikimli gecikmeleri etkili bir şekilde ortadan kaldırır.
Düşük Gecikmeli Kullanım Senaryoları
Senkronizasyon gecikmesini ve uçtan uca işlem gecikmelerini önemli ölçüde azaltan CO, ultra düşük gecikmeli ve düşük maliyetli işlemler gerektiren benzersiz kullanım senaryolarını mümkün kılmaya bizi bir adım daha yaklaştırır. Örneğin: (i) medya veya içerik erişimi için saniyelik faturalandırma gibi mikro ödemeler; (ii) taraflar arasında sürekli fon akışının olduğu akış ödemeleri (örn. kullandıkça öde abonelikleri); ve (iii) IoT (Nesnelerin İnterneti) cihazlarının veya merkeziyetsiz hizmetlerin gerçek dünya olaylarına dayalı ödemeler başlattığı otonom ödemeler.
Tüm bunların etkili bir şekilde çalışabilmesi için hızlı ve öngörülebilir işlem işleme, gerçek zamanlı veri yayılımı ve minimum senkronizasyon gecikmesi gereklidir. CO ile Aptos, bu yeni nesil kullanım senaryolarını desteklemek için daha iyi bir konumdadır — bizi gerçekten ölçeklenebilir, gerçek zamanlı bir dijital ekonomiye yaklaştırıyor.
Consensus Observer’ın Değerlendirilmesi
CO’yu Mainnet’e dağıtmadan önce değerlendirmek için farklı ortamlarda ve farklı iş yükleriyle çeşitli deneyler gerçekleştirdik. Bunlar arasında performans testleri, stres testleri ve kaos testleri yer aldı. Performans testlerine ve sonuçlarına ilişkin örnekler aşağıda özetlenmiştir:
Gerçekçi ortam simülasyonları: 30 doğrulayıcı ve 30 VFN ile “gerçekçi” bir ağ ortamı simüle ettik. Simülasyon, Aptos Mainnet’te görüldüğü gibi gerçek dünyadaki heterojenliği ve gecikmeleri taklit eden CPU ve ağ kaosunu içeriyordu. Bir coin transfer iş yükü yürüttük ve saniye başına işlem sayısını (TPS) çeşitlendirdik.
- Sonuçlar, CO’nun ortalama uçtan uca işlem gecikmelerini düşük yükte (yani 500 TPS) ~%10 ve daha yüksek yükte (yani 10k TPS) ~%30 oranında azalttığını gösterdi. Daha yüksek yük deneyinde gecikme süreleri ~2,1 saniye (geleneksel durum senkronizasyonu) ve ~1,5 saniye (CO) olarak ölçüldü.
Kaotik ortam simülasyonları: 30 doğrulayıcı, 30 VFN ve 30 PFN ile “kaotik” bir ağ ortamı simüle ettik. Simülasyon, Aptos Mainnet’te tipik olarak görülen değerlerin 2–3 katı kadar aşırı CPU ve ağ kaosunu içeriyordu. Bir coin transferi iş yükü uyguladık ve TPS’yi çeşitlendirdik.
- Sonuçlar, CO’nun ortalama uçtan uca işlem gecikmelerini düşük yükte (yani 500 TPS) ~%20 ve daha yüksek yükte (yani 5k TPS) ~%50 oranında azalttığını gösterdi. Daha yüksek yük deneyinde gecikme süreleri ~3,1 saniye (geleneksel durum senkronizasyonu) ve ~1,7 saniye (CO) olarak ölçüldü.
CO’nun doğruluğu birçok deneyde doğrulandıktan sonra, kademeli olarak Aptos Mainnet’e entegre edildi, yani tüm doğrulayıcılar, VFN’ler ve Aptos Labs tarafından işletilen PFN’ler genelinde. Entegrasyon sonrasında aşağıdaki gözlemleri yaptık:
- Düşük yükte %10 azalma: CO’nun dağıtımından bu yana, düşük ağ yükünde (~60 TPS) uçtan uca işlem gecikmesinde ~%10 azalma sağladı. Şekil 5’te gösterildiği gibi, etki anında ortaya çıktı: 28/11/2024 tarihinde CO Avrupa kümesinde etkinleştirildiğinde, gecikmeleri P10, P50 ve P90’da ~100 ms düştü; P50 ~800 ms’den ~700 ms’ye iyileşti. Benzer sonuçlar ABD, Asya ve Avrupa’daki tüm Aptos Labs PFN’lerinde gözlemlendi; bu da CO’nun küresel ölçekte tutarlı performans avantajlarını vurguluyor.
Şekil 5: CO’nun devreye alınması öncesi ve sonrasında Aptos Labs PFN’lerinin uçtan uca işlem gecikme süreleri
- Yüksek yüklerde %50 azalma: CO’nun dağıtımından bu yana, yüksek ağ yüklerinde (~8,5k+ TPS) uçtan uca işlem gecikmesinde ~%50 azalma sağladı. Örneğin, Şekil 6 yüksek yüklerde geleneksel durum senkronizasyonu ile CO arasındaki Mainnet işlem gecikmelerinin karşılaştırmasını göstermektedir. CO Mainnet’e dağıtılmadan önce, ~8,5k TPS’de işlem gecikmeleri 2,80s (P50), 3,45s (P75) ve 4,94s (P90) idi. CO Mainnet’e dağıtıldıktan sonra, ~10,9k TPS’de işlem gecikmeleri 1,46s (P50), 1,98s (P75) ve 3,20s’ye (P90) düşürüldü. Bu, P50’de ~%50, P75’te ~%40 ve P90’da ~%35 azalma olduğunu gösteriyor.
Şekil 6: Geleneksel durum senkronizasyonu ile consensus observer arasındaki Mainnet işlem gecikmelerinin yüzdelik dilimlerde (yani P50, P75 ve P90) karşılaştırılması.
Geleneksel Senkronizasyon ile Ödünleşimler
Geleneksel durum senkronizasyonunun önemli bir avantajı, tam düğümlerin işlem yürütmeyi atlamasına ve bunun yerine doğrulayıcılardan gelen yürütme sonuçlarını kanıtlar aracılığıyla yeniden kullanmasına olanak tanıyarak kaynak kullanımını azaltabilmesidir (buna akıllı senkronizasyon denir). Bu, CPU kullanımını azaltır, senkronizasyon verimliliğini artırır ve bir tam düğüm çalıştırmanın genel maliyetini düşürür.
Ancak CO, tam düğümlerin blokları gerçek zamanlı olarak yürütmesini gerektirir; bu da doğrulayıcılarla eşdeğer donanım kaynaklarına sahip olmaları gerektiği anlamına gelir, aksi takdirde yüksek yükte ayak uyduramazlar. Ayrıca, tam düğümlerin genellikle ek işlemler gerçekleştirdiği (örn. REST API ve istemci isteklerini yönetme) göz önüne alındığında, bu ek yükleri karşılayabilmeleri için tam düğümlerin daha güçlü donanımla donatılması çoğu zaman faydalıdır. Bu, göz önünde bulundurulması gereken bir ödünleşimdir; örn. CO’dan yararlanmak istemeyen tam düğüm operatörleri katılmamayı seçebilir ve bunun yerine geleneksel durum senkronizasyonunu kullanmaya devam edebilirler.
Consensus Observer’ı Etkinleştirme
CO, Aptos Mainnet’e zaten dağıtıldı ve tüm VFN’lerde varsayılan olarak etkinleştirilmiştir.
Ancak, operatörlerin yukarıda tartışılan ödünleşimler ve CPU gereksinimlerinin farkında olması gerektiğinden, CO tüm PFN’ler için varsayılan olarak etkinleştirilmemiştir. PFN’lerinde CO’yu etkinleştirmek isteyen operatörler buradaki talimatları izleyerek bunu yapabilirler.
Not: CO, Aptos Labs tarafından işletilen PFN’lerde (örn. https://api.mainnet.aptoslabs.com/ adresinde çalışanlar) zaten etkinleştirilmiştir.
Blok Zincir Senkronizasyonunda Yeni Bir Çağ
Consensus Observer ile Aptos, blok zincir senkronizasyonunu yeniden tasarlayarak yüksek verimle ultra düşük gecikmeli işlemlerin önünü açıyor. CO, tam düğümlerin blokları doğrulayıcılarla paralel olarak işlemesine izin vererek gereksiz gecikmeleri ortadan kaldırır ve kullanıcı deneyimini iyileştirir.
Aptos’un paralel ve ardışık yürütme mimarisi Zaptos ve 1 milyon TPS’nin üzerine çıkabilen yürütme motoru Shardines ile birleştiğinde, Aptos mevcut en hızlı ve en ölçeklenebilir Web3 blok zincir altyapısını sunma yolunda ilerliyor. Bu, yolculukta sadece bir başka adımdır.