SEMBOLLER, SİNYALLER, SESLER
J. Pierce
DESENLER VE SÜREÇLER
BİLGİ AKTARIMI
Pierse'nin Kitabı, Bilimsel Başarıların Yolları Ve Kaderleri Konusunda Çalışan Herkes İçin Hazırlanmıştır. Bir Matematikçi, Fizikçi, Kimyasal, Biyoloji Tarafından İlgiyle , Muhtemelen Ve Fayda Olarak Okuyabilir. Muhteşem Ve Bir Dilbilimci, Psikolog, Aht Müzik Veya Sanatçı, Bir Bilgi Sorununu Çözerken, Shannon'un Bilgi Teorisinin Ortaya Çıkan İsteklerini Karşılayıp Karşılamayacağını Öğrenecektir. Teorin Ve İletişim Teknikleri Alanında Uzman Biri, Akıllı Ve Kötü Yazarla Tartışmak Ve Bazı Sorularda O'nun Bakış Açısını Öğrenmek Mutluluğunu Reddetmez.
Curıus Okulu Çocukları Bile Çok Şeyi Anlayabilecek Ve En Modern Bilimsel Problemlerden Büyük Zevk Alacaklar.
JR, Pierce
SEMBOLLER f SİNYALLER ve GÜRÜLTÜ
İletişimin DOĞASI VE
SÜRECİ
lonbonlu hutchinson
J. Pierce
SEMBOLLER, SİNYALLER, SESLER
BİLGİ İLETİMİNİN DÜZENLİLİKLERİ VE SÜREÇLERİ
YAYIN EVİ
İngilizce'den çeviri,
V. V. TOPELBERG
Dr. tech.'in
editörlüğünde , Sciences
Prof. B. N. MİTAŞEVA
ÖNSÖZ
EDİTÖR
TERCÜME
Önünüzde, benim bilgi kuramı olarak da adlandırdığım modern matematiksel iletişim kuramının kökenini, gelişimini, yöntemlerini ve başarılarını anlatan popüler bir bilim kitabı var. Kitabın yazarı, Amerikalı bilim adamı John Pierce, bu alandaki uzmanlar arasında iyi tanınmaktadır. radyo elektroniği ve uygulamaları alanındaki bilimsel çalışmaları. Aynı zamanda kendisini bilimin yetenekli bir popülerleştiricisi olarak da kanıtladı. 1961 yılında “Electrons, Waves and Messages” (Physmatgiz, M., 1961) adlı kitabı okuyucularımız tarafından büyük ilgiyle karşılanan Rusça tercümesi çıktı ve şimdi de yeni kitabı “Quantum Electronics” (yayınlayan Mir'e). John Pierce'ın kurgu dışı kitapları, konu hakkında iyi bilgi veren o parlaklığa, yazarın yazardan ayrılmayan mizah anlayışına ve doğasında var olan pedagojik beceriye sahiptir.
1948'de matematiksel iletişim teorisinin temellerini oldukça genel bir biçimde formüle eden ve bu alandaki ilk temel sonuçları elde eden Claude Shannon'ın bilimsel başarısına bir övgü niteliğindedir. Bu zamana kadar, elektrik ve radyo iletişimi hayatımızın derinliklerine nüfuz etmişti. Bilim adamları ve mühendisler aktif ve ısrarlı bir şekilde her zamankinden daha etkili ve güvenilir iletişim araçları geliştirdiler ve uzun süre çözülemeyen teknik ve teorik sorunlarla karşı karşıya kaldılar. Ancak neyin başarıldığını değerlendirmek ve iyileştirmenin yollarını bulmak için soruna oldukça geniş ve genel bir yaklaşım gerekliydi. John Pierce, iletişim teknolojisi alanında bilimsel faaliyetine başladı ve matematiksel iletişim teorisinin oluşum sürecinin tamamı gözlerinin önünde ve doğrudan katılımıyla gerçekleşti. Sorunu açıkça formüle etmenin ve çözmenin zorlukları o kadar büyük ve Shannon'ın bulduğu yol o kadar etkili ve o kadar çok şey vaat ediyor ki, yazar elde edilenlere hayranlık duymaktan asla vazgeçmiyor. Bu hayranlığı okuyucuya aktarmaya çalışır.
Modern iletişim teorisi, herhangi bir matematiksel teorinin doğasında bulunan bir genelliğe sahiptir. Bu, diğer adı olan bilgi teorisine yansıdı. Matematiksel bir teori olarak bilgi teorisi, iletişim teknolojisinden bağımsız olarak bağımsız bir anlam kazanmıştır. Bununla birlikte, bu teoride "bilgi" terimi, niceliksel bir önlemin getirilmesine izin veren belirli bir içerik verilmiştir. Bu nedenle teorinin sonuçlarının ana uygulama alanı iletişim teknolojisi olmaya devam etmektedir. Bilgi kelimesiyle ilişkilendirilebilecek her şeyden uzak, Shannon'ın teorisine tabidir. Bu durumun hafife alınması veya yanlış anlaşılması, ortaya çıktığında yeni teorinin aşırı duygusal karşılanmasına yol açtı. Hepimiz bir şey hakkında bilgi sahibiyiz ve bu bilgiyi başkalarına aktarıyoruz ve bununla ilgili bir teori olduğunu bilmek bizi çok mutlu ediyor. Teoriye bağlanan umutlar büyük ölçüde gerçekleşmeyince, aceleyle ve aynı derecede haksız eleştirilere maruz kaldı. Kitabın yazarı, okuyucunun bilgi teorisini olduğu gibi takdir etmesi, temellerini, yöntemlerini, başarılarını ve olanaklarını anlaması için çok çaba sarf ediyor. Ayrıca teorinin dilbilim, psikoloji ve sanat gibi alanlardaki uygulama olanaklarına ilişkin bakış açısını da ifade eder. Burada bilgi teorisi, yanılsamalardan etkili bir şekilde kurtularak iyi bir sunumda ortaya çıkıyor.
Kitap, John Pierce'a özgü bir tarzda yazılmıştır. Bu, popüler bir sunumda iletişimin matematiksel teorisidir ve sadece onun hakkında konuşmak değildir. Okumak için iletişim teknolojisi alanında özel bilgi gerekli değildir, anlamak ve anlamak için ısrarlı bir istek duymak gerekir. Okuyucunun gerekli eğitime sahip olduğu varsayılır ancak bu, okulda öğretilenlerin kolayca unutulması anlamına gelir. Yazar, okuyucuyla konuşur, onu düşünmeye, itiraz etmeye ve nihayet mantıksal olarak teorinin ana ifadelerine gelmeye zorlar. Bu nazikçe ama ısrarla yapılır. Bazen yazar okuyucuyu neredeyse zorla sürükler, ancak daha sonra okuyucunun kendisi merak uyandıran ve bilinmeyeni çağıran sayfa sayfa coşkuyla okur. Tekrarların varlığına şaşırmaya gerek yok. Onlar sayesinde gerekli malzeme her zaman elinizin altındadır ve bireysel bölümler belirli bir bağımsızlık kazanır.
Kitap, bilimsel başarıların yolları ve kaderi hakkında endişe duyan herkese yöneliktir. Bir matematikçi, fizikçi, kimyager, biyolog ilgiyle ve belki de yararla okuyabilir. Bir dilbilimci, psikolog, müzisyen veya sanatçının Shannon'ın bilgi teorisinin şu veya bu bilgi problemini çözerken ortaya çıkan ihtiyaçlarını karşılayıp karşılamayacağını öğrenmesi muhtemeldir. İletişim teorisi ve teknolojisi alanında bir uzman, zeki ve kendini beğenmiş bir yazarla tartışmaktan ve bazı konularda onun bakış açısını öğrenmekten zevk almayacaktır. Meraklı okul çocukları bile çok şey anlayabilecek ve kendilerini en modern bilimsel problemlerle tanıştırmaktan büyük zevk alabilecekler.
El yazması biçiminde bile kitap, kurucusu Claude Shannon da dahil olmak üzere birçok önemli bilgi teorisyeni tarafından okundu. Yazar pek çok tavsiye ve yorum aldı, eleştiri ve itirazları dinledi. Pek çok şeyi hesaba kattı ve kabul etti ve yine de kitap bütünlüğünü ve özgünlüğünü korudu. Yazarın ve okuyucularımızın bazı ifadeleri ve muhakemeleri, tartışma, itiraz etme ve katılmama arzusuna neden olabilir. Bu, yazarın kendisinin polemik, eleştirel üslubuyla kolaylaştırılır; kendi görüşü.
Profesör B.Mityashev
YAZARDAN
James Newman'ın matematiksel iletişim kuramı üzerine bir kitap yazma önerisi beni çok mutlu etti. Sonuçta, tüm bilimsel çalışmalarım iletişim sorununun şu veya bu yönünün etkisi altında ortaya çıktı ve doğal olarak bence bu önemli bilim alanında ilginç ve tartışmalı olanı paylaşmak istedim.
1948 tarihli Mathematical Theory of Communication adlı eseri ortaya çıkmasaydı böyle bir kitap yazılamazdı . Yıllardır mühendisleri endişelendiren birçok iletişim sorunu, mantıklı sonucunu onda bulmuştur. Bilgi teorisi olarak da adlandırılan bu teorinin temelinde, birbirine bağlılığı tam olarak kavranamayan birçok farklı problem ve fikrin yerine geniş ama iyi tanımlanmış bir alan ortaya çıkmıştır. Ve burada Shannon'a hakkını vermek istiyorum.
Bana öyle geliyor ki, iletişimin matematiksel kuramı tam olarak Shannon'ın onu formüle ettiği biçimde açıklanmalıdır. Bilgi teorisi hakkındaki hikayemiz Shannon'ınkinden daha geniş olmalı, yani burada bu teorinin bilim ve teknolojinin çeşitli alanlarındaki doğru ve yanlış uygulamalarından bahsetmeliyiz, ancak Shannon'dan farklı olarak matematiği daha az kullanmalıyız.
Bizi bekleyen zorluk burada yatıyor. Daha az matematik mümkündür, ancak matematiği tamamen dışlamak imkansızdır . Sonuçta, bilgi teorisi matematiksel bir teoridir. Neyle ilgileneceğini belirleyen birkaç temel varsayıma dayanan teori, daha fazla mantıksal sonuç çıkarır. Hem şaşırtıcı hem de önemli olan matematik teoremleri, bilgi teorisinin güzelliğidir. Gerçek matematiksel içeriğini ortaya koymadan onun hakkında konuşmak, olağanüstü bir besteci hakkında sonsuz uzun bir süre boyunca onun eserlerinin seslerini duymanıza izin vermeden konuşmakla aynı şeydir.
Nasıl yapmalıydım? Bana öyle geldi ki kitap bağımsız hale getirilmeli, yani diğer kitaplara başvurmadan ve örneğin cebir gibi temel matematiğin bazı bölümlerinin sunulacağı özel bir bölüm oluşturmadan içindeki matematiksel akıl yürütme anlaşılabilecek. Bu, matematiksel tartışmalardan tamamen kaçınmam gerektiği anlamına mı geliyordu? Zorunlu değil, ancak herhangi bir matematiksel ifadenin en anlaşılır şekilde açıklanması gerekiyordu. Hem metinde hem de uygulamada yapmaya çalıştım. Hem kitabın metnini hem de eki kullanarak, çok hazırlıklı olmayan bir okuyucu bile ana zorlukların üstesinden gelebilir. Ancak matematiksel ispatlarda ne derece zorluk tolere edilebilir? Bazı çok önemli noktaların atlanacağını bilerek, örneğin Newman'ın Matematik Dünyası'ndaki daha zor pasajlardan daha kolay bir açıklamaya bağlı kalmaya karar verdim. Çok zor yerlerde sadece kullanılan matematiksel ifadenin temel özelliklerini belirttim ve özüne inmedim.
Yine de bu kitap, az matematik bilgisi olan bir okuyucu için zor olan bölümler içeriyor. Bu tür okuyuculara, ellerinden gelen her şeyi yakalamaya çalışarak bu bölümleri gözden geçirmelerini tavsiye ediyorum. Ve sonra, kitabın tamamını okuduktan sonra okuyucu, bu zor bölümleri kitaba dahil etmenin neden gerekli olduğunu anlayacaktır. Ve sonra, isterse, onlara tekrar dönebilir, böylece artık onları gerçekten anlayabilir. Ama bu zor bölümleri kitaba dahil etmeseydim ve okuyucu her şeyin nereden geldiğini anlamak isteseydi, şaşkına dönerdi. Bildiğim kadarıyla, iletişimin matematiksel kuramıyla ilgili diğer kitaplar ya çok ilkel ya da çok zor. Ayrıca bazı konuların açıkça belirtilmediğini ve bazılarının tamamen yanlış olduğunu da fark edebilirim.
Aynı çizgide devam ederek, muhtemelen adil bir soru soracağım: bilgi teorisi tüm bu zahmete değer mi? Sadece tüm bilim ve teknoloji dünyası kadar bu teorinin de önemli olduğu cevabını verebilirim, çünkü bu dünyanın önemli bir parçasıdır. Meraklı okuyucunun bu dünya ve bilgi teorisi hakkında bilmek istediği şey, onu anlamak için harcanan zamana değip değmeyeceğini belirler. Sonuç olarak, matematiksel iletişim teorisi okuyucuya tamamen yabancı ve anlaşılmaz bir şey olarak görünmemeli, aynı zamanda birkaç kelimeyle kolayca tanımlanabilecek kadar basitleştirilmiş olmamalıdır.
Bu kitabı yazmak kolay bir iş değildi. Bana bu çalışmayı yazmam için ilham vermekle kalmayıp taslağı okuyup birkaç önemli değişiklik öneren Claude Shannon'ın çalışmaları olmasaydı, elbette gün ışığını hiç görmeyecekti. David Slepyan, benden hata yapma ve kafa karışıklığı yapma alışkanlığımı daha da güçlü bir şekilde silkeledi. E. Hilbert bazı örneklerde hatalara karşı uyardı ve Milton Babbit “Bilgi Kuramı ve Sanatı” bölümünün içeriğiyle içime huzur getirdi . P. Brikker, G. Jenkins ve R. Shepard bana psikoloji alanında tavsiyelerde bulundular, ancak sonunda benimsediğim bakış açısı kesinlikle onlara atfedilmemeli. M. Matthews 11. bölümde bilgisayar programını yazdı. B. Mandelbrot 12. bölümde bana yardım etti. J. Runyon taslağı dikkatlice okudu ve E. Wolman metinde çok sayıda hata buldu ve birçok değerli öneride bulundu. Okur, her bölümün sonunda bazı sonuçlar çıkarabildiğimi ve en azından sonunda bazı zor pasajları biraz daha net bir şekilde ortaya koymaya çalıştığımı James Newman'a borçludur. Ama her şeyden önce, el yazmasının hazırlanması ve çizimlerin işlenmesi sırasında hüküm süren kaostan onurla çıkmayı başaran F. Castello'ya son derece minnettarım.
birinci bölüm
1948'de Claude Shannon "A Mathematical Theory of Communication" başlıklı bir makale yayınladı; 1949'da zaten bir kitap şeklinde çıktı. Bundan önce, bireysel bilim adamları zaman zaman matematiksel bir iletişim teorisi yaratmaya çalıştılar. Ve şimdi, on iki yıl sonra, bu teori ya da bazen adlandırıldığı şekliyle bilgi teorisi, yerleşik bir çalışma alanıdır. Matematiksel iletişim teorisi üzerine epeyce kitap yayınlandı ve birkaç uluslararası sempozyum ve konferans düzenlendi. Radyo Mühendisleri Enstitüsü, bilim adamları "İşlemleri" üç ayda bir yayınlanan bir bilgi teorisi uzmanları grubuna sahiptir ve "Bilgi ve Kontrol" dergisi esas olarak matematiksel iletişim teorisine ayrılmıştır.
Hepimiz "iletişim" ve "bilgi" kelimelerini kullanıyoruz ve bunların önemini neredeyse hiç hafife almıyoruz. Modern filozof A. Ayer, iletişimin hayatımızdaki büyük öneminden ve öneminden bahsediyor. Ona göre sadece bilgi değil, “bilgi, hata, fikir, fikir, tecrübe, arzu, emir, duygu, duygu, ruh hali” de aktarıyoruz. Isı ve hareketin yanı sıra güç, zayıflık ve hastalık da iletilebilir.” İnsan toplumundaki bağlantıların çeşitli tezahürleri ve gizemli özellikleri hakkında başka örnekler veriyor ve konuşuyor.
İletişim çok çeşitli ve önemli olduğu için, doğru ve yararlı bir iletişim teorisi doğal olarak bizim için çok değerlidir.
Bununla birlikte, teori kelimesine tüm katı ve büyülü anlamı ile matematiksel kelimesini eklersek , o zaman teori neredeyse karşı konulamaz bir şekilde çekici hale gelir. Belki de sadece birkaç formül tüm iletişim sorunlarımızı çözmeye yardımcı olacak ve dezenformasyonun kölelerinden bilginin efendisi olacağız. Ne yazık ki, bilim diğer tarafa gidiyor. Yaklaşık 2.300 yıl önce, başka bir filozof olan Aristoteles, Fizik adlı eserinde iletişim kadar evrensel bir kavram olan hareketi tanımlamaya çalıştı.
Aristoteles, hareketi potansiyel olarak var olanın gerçekleşmesi (potansiyel olarak var olduğu sürece) olarak tanımladı. Arttırılıp azaltılabilen, ortaya çıkıp yok olabilen ve yaratılabilen şeylerin artmasını ve azalmasını hareket kavramına dahil etti. Üç hareket kategorisinden bahsetti: büyüklük, etki ve konum. Ona göre "olmak" kelimesinin ne kadar anlamı varsa o kadar çok hareket türü bulmuştur.
Burada hareketi tüm çeşitliliğiyle görüyoruz. Belki de bu çeşitlilik bizi biraz karıştırıyor, çünkü farklı dillerde kelimelerin bağlantısı farklı ve hareketi Aristoteles'in bahsettiği tüm değişikliklerle ilişkilendirmeyeceğiz.
Ancak Aristoteles'in takipçileri için hareketin özü ne kadar gizemliydi! Newton'a kadar iki bin yıldan fazla bir süre bir sır olarak kaldı.
Mühendislerin hala bunlara dayanarak makineler tasarladığı ve astronomların yıldızların, gezegenlerin ve uyduların hareketlerini incelediği kanunları ilan ettim . Doğru, fizikçiler daha sonra Newton yasalarının daha genel yasaların özel bir durumu olduğunu ve bunların yalnızca ışık hızından çok daha düşük hızlarda ve atomdaki olgu ölçeklerinden çok daha büyük olgu ölçeklerinde uygulanabileceğini keşfettiler. Yine de Newton yasaları tarihi bir anıt değil, fiziğimizin yaşayan bir parçasıdır. Ve hareket dünyamızın önemli bir parçası olduğu için, tabii ki Newton'un hareket yasalarını bilmeliyiz. İşte buradalar:
Vücut, üzerine bir kuvvet etki edene kadar hareketsiz kalmaya veya düz bir çizgide sabit bir hızla hareket etmeye devam eder.
Cismin hızındaki değişim kuvvet yönünde meydana gelir ve değişimin büyüklüğü cisme etki eden kuvvetle doğru orantılı, kuvvetin etki ettiği süre ile çarpılır ve cismin kütlesi ile ters orantılıdır. vücut.
Birinci cisim ikinci cisme bir kuvvet uyguladığında, ikinci cisim birinci cisme eşit ve zıt bir kuvvet uygular.
Newton bu yasalara evrensel yerçekimi yasasını ekledi:
İki madde parçacığı, bağlantı hattı boyunca etki eden bir kuvvetle birbirini çeker ve bu kuvvet, parçacıkların kütlelerinin çarpımı ile orantılı ve aralarındaki mesafenin karesiyle ters orantılıdır.
Newton'un yasaları bilim ve felsefede devrim yarattı. Bunları kullanarak Laplace, güneş sisteminin tamamen açıklanabilir bir mekanizma olduğunu gösterdi. Uçak ve roket biliminin ve astronomi gibi bilimlerin temelini oluşturdular. Ancak bu yasalar, Aristoteles'in hareket kavramıyla ilgili olarak ele aldığı pek çok soruyu yanıtlamak için yeterli değildi. Newton'un yasaları hareket problemini formülasyonunda çözmüştü, ama hareketin MÖ 4. yüzyılda Yunanistan'da veya yirmi yüzyıl sonra İngiltere'de verilebileceği tüm anlamlarıyla çözemedi .
Konuşmamız günlük ihtiyaçlarımıza ve belki de atalarımızın kavramlarına göre uyarlanmıştır. Her bir nesne ve her bir kavram için farklı kelimelere sahip olamayız. Mümkün olsaydı, o kadar çok kelime biriktirirdik ki, insanlar arasındaki iletişim düşünülemez hale gelirdi! Genel olarak bir dilin ortaya çıkması için birçok şeyin veya birçok olgunun tek kelime ile çağrılması gerekir. Bir adam ve bir atın koştuğunu (bir atın dörtnala koştuğunu söylemeyi tercih etmemize rağmen), saatlerin koştuğunu, düşüncelerin aktığını, bir derenin aktığını söylemek oldukça doğaldır.
Bu ifadelerin benzerliği, bu ifadelerin tasvir ettiği fiziksel olayların benzerliğinden değil, dilimizin özelliklerinden kaynaklanmaktadır. Hem zamanın akışını hem de düşüncelerin akışını kapsayan basit, tutarlı ve aynı zamanda faydalı bilimsel bir koşu teorisi aramak saçma olurdu. Ve elbette, Aristoteles tarafından ele alınan tüm hareket türlerini veya daha sonra bilim adamları tarafından keşfedilen tüm iletişim ve bilgi türlerini tek bir teoride kapsamaya çalışmak daha az saçma olmaz.
Günlük konuşmada kelimeleri bize uygun şekilde kullanırız. Bilim, dilbilim dışında, kelimelerin kendileriyle ve aralarındaki ilişkilerle ilgilenmez. Birleştirilebilen ve anlaşılabilen insan ve onun faaliyetleri gibi daha gerçek şeylerle ilgilenir. Böyle bir anlayış, genel bir modeli karmaşık ve ilk bakışta farklı fenomenler (örneğin, gezegenlerin hareketi ve buz üzerinde kayan bir patencinin hareketi) olarak görme ve ardından bunları olabildiğince basit ve doğru bir şekilde tanımlama yeteneğinde yatmaktadır. olası.
Bu tür bilimsel açıklamalarda kullanılan kelimeler genellikle günlük kelimelerden alınır. Newton şu kelimeleri kullandı: kuvvet, kütle, hız ve çekim. Ancak bilimdeki bu kelimeler özel, daha dar ve hatta çoğu zaman yeni bir anlam kazanmıştır. Koşulların gücünden, yolların kütlesinden, Brigitte Bardot'nun çekici gücünden bahsederek Newton yasalarını uygulayamazsınız. Aynı şekilde, "iletişim" ve "bilgi" kelimeleri farklı durumlarda kullanılabilir, ancak bu, bu kelimelerin geçtiği her yerde, matematiksel iletişim teorisinin kullanılabileceği anlamına gelmez.
Uygun bilimsel teori, acil sorunlara nadiren çözümler sunar. Birçok sorumuzun yanıtını vermesi neredeyse hiç olmuyor. Teori, kural olarak, fikirlerimizi ve varsayımlarımızı doğrulamaz, ancak genellikle onları tamamen terk eder veya en iyi ihtimalle olduğu gibi bırakır. Teori genellikle deneyimlerimizi genelleştirmenin yeni ve orijinal bir yolunu sunar ve ondan hangi sonuçların çıkarılabileceğini gösterir. Bu kitapta iletişimin matematiksel kuramı bu bakış açısıyla ele alınmaktadır.
Deneyimlerimizden genelleştirilebilecek olan seçildiğinde ve bu genelleme yapıldığında ve ilgili sonuçlar çıkarıldığında, ancak o zaman herhangi bir soru için bir teoriye sahip oluruz. Böylece teorik fiziğin mekanik adı verilen önemli bir alanı Newton'un hareket yasaları üzerine kuruludur . Yasaların kendileri henüz bir teori değiller, tıpkı aksiyomların veya postülaların geometrinin temelini oluşturması gibi, onlar sadece onun temelidir. Teori sadece varsayımları değil, aynı zamanda bu varsayımlardan zorunlu olarak çıkan mantıksal sonuçların matematiksel bir incelemesini de içerir. Teori doğruysa, o zaman sonuçları, elbette, doğanın karmaşık fenomenlerini doğru bir şekilde yansıtmalıdır, ancak yanlışsa, o zaman sonuçları işe yaramaz.
Fikirler ve varsayımlar, bir teorinin genelliğini , yani uygulanabilir olduğu fenomenler aralığının ne kadar geniş olduğunu belirler. Bu nedenle, örneğin Newton yasaları en genel niteliktedir - gezegenlerin hareketini, bir sarkacın özelliklerini ve herhangi bir mekanizmanın ve makinenin davranışını açıklarlar. Ancak radyo dalgalarının özelliklerini açıklamazlar.
Maxwell denklemleri * en genel niteliktedir - tüm (kuantum olmayan) elektriği açıklarlar.
♦ 1873 yılında James Clerk Maxwell ilk kez “Elektrik ve Manyetizma” adlı çalışmasında elektrik alan, manyetik alan ve elektrik akımı ile ilgili doğa kanunlarını ortaya koymuş ve tam olarak açıklamıştır. Yayılma hızı ışık hızına eşit olan elektromanyetik dalgaların (radyo dalgaları) olması gerektiğini gösterdi . Daha sonra Hertz bu dalgaları deneysel olarak keşfetti ve artık ışığın da bir elektromanyetik dalga olduğu biliniyor. Maxwell'in denklemleri, onun elektrik ve manyetizma teorisinin matematiksel formülasyonudur ve tüm elektrik biliminin temelidir.
17
2 j. Delme fenomeni. Elektrik mühendisliğinin dallarından biri olan devre teorisi, üç tip idealize edilmiş elemanlardan oluşan elektrik devrelerinin özelliklerinin incelenmesiyle ilgilenir: dirençler (bobin şeklindeki cihazlar, yum ağız πττ τ⅜τ X ince , zayıf iletken tel veya elektrik akımının geçişini önleyen metal veya karbon filmler), indüktörler (bakır tel ile sarılmış bobinler, bazen bir manyetik malzeme çekirdeği ile) ve kapasitörler (bir dielektrik - mika veya plastik ile ayrılmış ince metal levhalar; ilk kapasitör bir Leyden kavanozuydu). Devre kuramı yalnızca birkaç idealize edilmiş öğeden oluşan devrelerin elektriksel özelliklerini kapsadığından, fizikçiler bunun herhangi bir fiziksel öğenin elektriksel özelliklerini ve hatta radyo dalgalarının özelliklerini kapsayan Maxwell denklemlerinden daha az genel olduğuna inanıyorlar .
* Elbette, geniş bir fenomen yelpazesini açıklayan bir teori ne kadar genelse, o kadar güçlü ve iyidir. Daha genel bir teori her zaman basit durumlara uygulanabilir. Bu nedenle fizikçiler, mekanik yasalarını, yerçekimi yasalarını ve tüm elektriksel olayları kapsayacak bir birleşik alan teorisi arıyorlardı. İlk bakışta, mümkünse matematiksel iletişim teorisinin işgal ettiği yeri belirleyerek, tüm teorilerin genellik sırasına göre düzenlenebileceği görülüyor.
Ne yazık ki, her şey o kadar basit değil. Devreler teorisi bir yandan Maxwell denklemlerinden daha az geneldir ve diğer yandan devreler teorisinin tüm matematiksel sonuçları hem mekanik elemanlardan oluşan salınımlı sistemler hem de idealleştirilmiş elektrik elemanlarından oluşan salınımlı sistemler. Devre teorisini mekaniğe uygularsak; daha sonra yay kapasitöre, kütle - endüktansa ve amortisör veya amortisöre (kapıya çarpmayacak şekilde yerleştirilen) - dirence karşılık gelecektir. Devre teorisi, mekanik sistemlerin özelliklerini açıklamak için uygulanabilir ve akustikte bu şekilde kullanılır. Devre teorisinin idealleştirilmiş elektrik sistemlerinin incelenmesinden ortaya çıkması, kaçınılmaz olmaktan çok tarihsel bir kazadır.
mekanik sistemlere tamamen uygulanamayan Maxwell denklemlerinden bir anlamda daha genel olduğunu söyleyebiliriz . Ancak öte yandan, Maxwell'in denklemleri devre teorisinden daha geneldir, çünkü bunlar sadece belirli bir idealleştirilmiş elektrik devreleri sınıfına değil, tüm elektrik sistemlerine uygulanabilir.
Bu gerçeği tam olarak açıklamak mümkün değil, bu yüzden bunun böyle olduğunu kabul etmeniz gerekiyor. Yine de bu çelişkiyi çözmeye çalışacağız. Bazı teoriler tamamen fiziksel teorilerdir. Bunlar, Newton yasalarını ve Maxwell denklemlerini içerir. Newton'un yasaları mekanik olaylarla ilgilenirken, Maxwell'in denklemleri elektriksel olaylarla ilgilidir. Devre teorisi tamamen matematiksel bir teoridir. İçinde kullanılan ifadeler çok çeşitli fiziksel anlamlara sahip olabilir. Bu teori, hem mekanik hem de elektriksel titreşimler olmak üzere çeşitli fiziksel fenomenler hakkında pek çok ilginç şey söyleyebilir.
Genellikle matematiksel bir teori, bir veya daha fazla fiziksel teorinin bir dalıdır. Bazı genel fizik teorilerinin bazı sorularının zarif bir matematiksel açıklaması olabilir - ⅛hh. Devre teorisi, hem mekanik hem de elektrikli cihazlarda ortak olan belirli fiziksel özelliklerin bu sunumudur. Matematiğin dallarından biri olan potansiyel teorisinde, elektrik alanları, manyetik alanlar ve yerçekimi alanları ve hatta bir dereceye kadar aerodinamik için eşit derecede önemli olan sorular ele alınır. Ancak tüm matematiksel teorilerin kaynağı fizik değildir. Kökeni zaten matematiksel olan teoriler var. Maddi dünyayı incelerken, genellikle bu tür teorileri kullanırız. Bunlardan biri aritmetiktir. Herhangi bir nesne veya nesne grubu olsun - elmalar, köpekler veya insanlar. Her nesneye belirli bir sayı atayalım: biri - biri, diğeri - 2 , vb. 8 nesne (16:2 = 8 için ) ve bu nesnelerin kare şeklinde düzenlenebileceğini - 4 sıra 4 nesne ( 16 = 4X4).
Ayrıca, nesneler bir sıra halinde düzenlenirse, bunun yapılabileceği yolların sayısı 2.092.278.988.800'e eşit olacaktır, bu da 1'den 16'ya kadar 2.092.278.988.800 farklı olası tamsayı dizisine karşılık gelir . Nesneler 16 yerine olsaydı , ama 13, o zaman grubumuz belli ki herhangi bir sayıda eşit gruba bölünemez, çünkü 13 bir asal sayıdır ve faktörlerin bir ürünü olarak temsil edilemez. Görünüşe göre bu sonuçlar nesnelerin özelliklerine hiç bağlı değil. Sayılar herhangi bir nesneyi gösterebileceğinden, sayıların toplama, çıkarma, çarpma, bölme işlemlerinin sonuçları ile sayıların farklı bir sırada düzenlenmesiyle elde edilen sonuçlar doğru olacaktır. Sayılar ve nesneler arasındaki bağlantı bize o kadar doğal görünüyor ki, aritmetiğin kendisinin matematiksel bir teori olduğu ve herhangi bir matematiksel teori gibi, sayıların özellikleri nesnelerin özelliklerine karşılık geldiğinde uygulanabileceği gerçeğini kolayca gözden kaçırabiliriz. materyal Dünya.
Fizikçiler, elektronlar gibi temel parçacıkların toplam sayısını saymanın mümkün olduğunu, ancak bu parçacıklar kelimenin tam anlamıyla ayırt edilemez oldukları için her parçacığa belirli bir sayı atamanın imkansız olduğunu söylüyorlar. Bu nedenle, parçacıkların farklı bir düzende dizilişinden söz edilemezken, bunu sayılarla yapmak oldukça mümkündür. Bu sonuç, fiziğin istatistiksel mekanik adı verilen alanlarından biri için çok önemlidir . Ayrıca başka bir matematiksel teori olan Öklid geometrisinin topograflara ve denizcilere iyi hizmet ettiğini unutmayın, ancak Öklid geometrisinin astronomik fenomenler söz konusu olduğunda tamamen doğru olmadığına inanmak için her türlü neden vardır.
Teoriler nasıl sınıflandırılabilir? Teori, kullanıldığı alana göre dar veya genel olabilir. Bir teori ayrıca tamamen fiziksel veya tamamen matematiksel olabilir. Kesinlikle fiziksel bir teori, sınırlı bir fiziksel fenomen yelpazesini tam olarak tanımlar. Bir teori, idealize edilmiş bir fenomen sınıfıyla veya bir fenomenin yalnızca bir yönüyle ilgilendiğinde daha matematiksel veya soyut hale gelir. Newton'un yasaları, gezegenlerin hareketi ve bir sarkacın özellikleri gibi mekanik olguları tam olarak tanımlamak için kullanılabildiklerinden, kesinlikle fiziksel yasalardır. Devre teorisi , çok çeşitli idealize edilmiş fiziksel olayların incelenmesinde yararlı olduğu için daha matematiksel bir teoridir. Aritmetik tamamen matematiksel ve soyut bir bilimdir. Birçok fiziksel nesnenin ortak bir özelliğini, sayısal bir değerin varlığını aynı şekilde ele alır; Köpekler, insanlar veya elektronlar (elektronların ayırt edilemez olduğunu hatırlayın) bu özelliğin hangi nesnelere sahip olduğu onun için hiç fark etmez. Aritmetik, takvim yaparken bile yararlıdır.
Tanımlarımızı kullanarak, bilgi teorisi matematiksel ve genel bir teori olarak adlandırılabilir. Bu teori, elektriksel iletişim çalışmasından kaynaklanmasına rağmen, sorunları genel ve soyut yollarla çözer. "Seçim" ve "belirsizlik" kavramlarını kullanan bu teori, evrensel bir bilgi ölçüm birimi - biraz - sunar. Eşlenebilir iki olasılıktan birinin uygulanması sonucu bir bitlik bilgi elde edilir ve bu olasılıklar iletilen mesajlar veya sayılar olarak anlaşılabilir. Bilgi teorisi, özelliklerine bağlı olarak ideal ve ideal olmayan bir iletişim kanalı üzerinden saniyede kaç bit bilgi iletilebileceğini söyler. Bilgi teorisi, konuşan veya yazan bir kişi gibi hangi mesaj kaynağının bilgi oluşturduğunun hızının nasıl ölçüleceğini anlatır. Elektrik devresi gibi belirli bir kanal üzerinden iletilmek üzere belirli bir kaynaktan gelen mesajları en iyi nasıl temsil edeceğimizi veya daha verimli bir şekilde nasıl kodlayacağımızı anlatır ve ayrıca iletim hatalarının ne zaman önlenebileceğini söyler.
Bilgi teorisi, sorunları çok genel ve soyut bir şekilde ele alır, bu nedenle sağladığı bilgiyi belirli pratik problemleri çözmek için kullanmak genellikle zordur. Ancak bu teorinin geniş bir uygulama yelpazesine sahip olmasının nedeni kesinlikle soyut matematiksel formdur. Dilbilimde, mesajların elektriksel ve mekanik iletiminin incelenmesinde, makinelerin işleyişinde ve belki de insanların davranışlarında yararlıdır. Bazı okuyucular muhtemelen bunun fizik için de çok önemli olduğunu tahmin ediyor. Bunun hakkında daha sonra konuşacağız.
Ama bilgi teorisi, Shannon'ın verdiği şekliyle, temelde matematiksel bir teoridir. Ana hükümleri matematik dilinde formüle edilmiştir ve çok çeşitli fiziksel anlamlara sahip olabilir. Bilgi teorisi mühendisler, psikologlar ve fizikçiler tarafından kullanılabilir, ancak fiziksel, psikolojik veya mühendislik teorisi değil, matematiksel bir teori olarak kalır.
Matematik teorisini halka aktarmak kolay değildir. Bilgi teorisi matematiksel bir teori olduğu için, matematikten tamamen kaçınmadan onun hakkında konuşulabileceğini söylemek gülünç olur. Ancak okuyucumuz formüller ve denklemlerden korkmasın, ladin tarafından da açıklanan fikirleri doğru bir şekilde yansıtıyorlar. Matematiğe aşina olmayan okuyucunun denklemleri doğru bir şekilde anlamasına yardımcı olmak için, kitaba tüm matematiksel notasyonu veren bir ek ekledim.
"Matematik" sözcüğüyle birlikte, çoğu kez, çarpma, bölme, kök çıkarma gibi tatsız resimlerin ve okulda çalışmanın en acı anlarının hafızamda belirdiğinin farkındayım. Ancak böyle bir matematik fikri bir yanılsamadır, çünkü içindeki asıl şey formüllerle çeşitli hileler ve manipülasyonlar değil, teoremler ve ispatlardır. Okur belki geometride teoremler ve ispatlarla karşılaşmış veya belki de hiç karşılaşmamıştır; Ne olursa olsun, hem saf hem de uygulamalı matematikte en önemli şey teoremler ve ispatlardır. Ve bilgi teorisinde, önemli sonuçlar matematiksel teoremler şeklinde sunulur ve bunlar gerçekten teoremlerdir, çünkü bunların doğruluğunu kanıtlamak mümkündür.
Matematikçiler bir tanım getirerek ve bazı varsayımlarda bulunarak başlarlar ve ardından matematiksel akıl yürütme veya ispatlar kullanarak bazı ifadelerin veya teoremlerin geçerliliğini gösterirler. Shannon'ın “The Mathematical Theory of Communication” adlı çalışmasında yaptığı tam olarak buydu. Bir teoremin doğruluğu, yapılan varsayımların geçerliliğine ve ispatındaki akıl yürütmenin kesinliğine bağlıdır.
Bütün bunlar oldukça soyut. Teoremin ve ispatın özü , elbette en iyi şekilde bir örnekle gösterilir. Ancak deneyimsiz bir okuyucudan bilgi teorisinin zor teoremlerine girmesini ve dahası tüm detayları incelemesini talep edemem. Bu tür teoremlerin kanıtlarını gerçekten anlamak, biraz matematik bilgisi olanlar için bile çok zaman ve yoğun dikkat gerektirir. En iyi ihtimalle, yalnızca bu teoremlerin anlamını ve önemini kavramaya çalışabiliriz.
Burada daha basit matematik teoremlerine ve ispatlarına bazı örnekler vermek istiyorum. İlk örnek , hex adlı bir oyundur , Kanıtlayacağımız teorem , ilk hamleyi yapan oyuncunun kazanabileceğidir.
49 altıgen hücreden oluşan bir tahta üzerinde oynanır (Şekil 1.1); üzerlerine cips koyabilirsiniz. Oyunculardan biri siyah taşlarla oynar ve onları sağ ve soldaki siyah kareler arasında bir yol oluşturacak şekilde yerleştirmeye çalışır ve yol herhangi bir dolambaçlı olabilir. Diğer oyuncu beyaz fişlerle oynar ve sırayla aynı yolu beyaz fişlerle ve üstteki ve alttaki beyaz alanlar arasında oluşturmaya çalışır. Hamleler oyuncular tarafından tek tek yapılır ve bir hamlede bir çip koyulmasına izin verilir. Tabii ki, oyunculardan biri başlamalıdır. Ona ilk oyuncu diyelim.
İlk oyuncunun kazanabileceğini kanıtlamak için, önce oyunun zorunlu olarak oyunculardan birinin zaferiyle sona erdiğini gösteriyoruz.
Teorem I. Oyunculardan biri mutlaka kazanır.
Akıl yürütme Bazı oyunlarda, örneğin satranç veya tic-tac-toe, kimse kazanmayabilir, yani oyun berabere biter. Kura atışı gibi diğer oyunlarda, oyunculardan birinin kazanacağı kesindir. Teoremimizin kanıtı, tahtanın her karesinde siyah veya beyaz bir taş varsa, o zaman siyah alanlar arasında siyah taşlardan veya beyaz alanlar arasında beyaz taşlardan oluşan sürekli bir yol olması gerektiğini göstermek olacaktır. beyaz alanlar arasında beyaz çiplerden ve ikinci durumda - siyah alanlar arasında siyah çiplerden hiçbir yol olmayacak, yani beyaz veya siyah kazanmalıdır.
Kanıt. Her hücrenin siyah (şekilde sırasıyla karartılmış) veya beyaz bir çip ile doldurulduğunu varsayalım. Tahtanın sol üst köşesinden başlayalım (nokta I Resimde. 1.2) ve beyaz ve siyah altıgenler arasındaki sınırı çizin. Siyahlar sağda beyazlar solda olacak şekilde hareket edeceğiz.
Bu şekilde çizilen bir bordür, ya tahtanın kenarlarındaki köşelerde ya da altıgenlerin kenarlarının birleştiği köşelerde yön değiştirecektir. Her iki durumda da sınır sadece iki şekilde yön değiştirebilir (Şekil 1.3). Ya sağda iki siyah altıgen olacak ve solda bir beyaz (Şek. 1.3, a) veya solda iki beyaz altıgen ve sağda bir siyah olacak (Şek. 1.3, b). Her iki durumda da sınırın sağında sürekli siyah bir yol ve sınırın solunda sürekli beyaz bir yol olacağını unutmayın. Ayrıca, hiçbir durumda sınırın kendi kendine kesişme veya birleşme olamayacağına dikkat edin, çünkü köşeden yalnızca bir yönde geçilebilir, böylece siyah sağda ve beyaz solda olur. Söylenen her şeyin siyah alanlar ile beyaz altıgenler arasındaki sınır ve beyaz alanlar ile siyah altıgenler arasındaki sınır ve siyah ve beyaz altıgenler arasındaki sınır için geçerli olduğunu görmek kolaydır. Bu nedenle, sınırın solunda, üstteki beyaz kutuya giden sürekli bir beyaz altıgen yolu ve sınırın sağında, soldaki siyah kutuya giden sürekli bir siyah altıgen yolu olmalıdır. Sınır kendi kendine kesişemez, bu nedenle sonsuza kadar daire çizemez ve sonunda ya siyah ya da beyaz bir alana ulaşacaktır. Sınır siyah veya beyaz bir alana ulaşırsa ve bizim koşulumuza göre siyah sağda ve beyaz solda ise, o zaman nokta II dışında herhangi bir yerde veya noktalar III 1 sağda siyah ve solda beyaz olacak şekilde kenarlık devam ettirilebilir. Bu nedenle sınır, II 1 noktasına ulaşacaktır. veya III. Sınır II noktasına ulaşırsa (bkz. Şekil 1.2), o zaman sınırın sağındaki sol siyah alana bağlı siyah altıgenler sağdaki siyah alana bağlanacak ve sınırın solundaki beyaz altıgenler sadece en üstteki beyaz kareye bağlanın ve siyah kazanacaktır. Beyaz'ın aynı anda kazanması imkansızdır, çünkü siyah taşların soldan sağa kesintisiz bir şekilde dokunması zResimi, beyaz taşların yukarıdan aşağıya sürekli bir yolunu engelleyecektir. Aynı şekilde tartışarak, sınır III noktasına ulaşırsa Beyaz'ın kazanacağını görmek kolaydır .
Teorem I • İlk hamleyi yapan oyuncu kazanır.
Akıl yürütme Kelime, oyuncunun bunu nasıl yapacağını anlaması koşuluyla, kazanmanın bir yolu olduğu anlamına gelebilir . Kazanmanın yolu, belirli bir ilk hamle yapmak (görünüşe göre, farklı bir ilk hamle yapmak oldukça mümkündür, ancak hepsini bilmek kesinlikle gerekli değildir) ve bir şemaya, formüle, talimata veya reçeteye sahip olmaktır (buna denir). İstediğiniz gibi alın), size oyunun herhangi bir aşamasında rakibin hamlesine doğru hamle ile cevap verme fırsatı verir. İlk oyuncu bu tarife uyarsa, rakip hangi hamleyi yaparsa yapsın kazanır.
Kanıt. Ya birinci oyuncunun kesinlikle kazanacağı böyle bir oyun yöntemi olmalı ya da birinci oyuncu nasıl oynarsa oynasın rakibi her zaman birincinin, yani ikinci oyuncunun kazanmasına izin vermeyecek bir hamle bulabilir. kazanacak. İkinci oyuncunun kazanmak için gerçekten güvenilir bir tarifi olduğunu varsayalım. İlk oyuncunun ilk hamleyi yapmasına izin verin ve ardından, rakibinin ilk hamlesinden sonra, sözde ikinci oyuncunun kazanmasına izin veren tarifi uygulayın. İlk oyuncunun bir turda daha önce dolu olan bir alana bir taş koyması gerekiyorsa, bırakın o taşı boş olan herhangi bir yere koysun. Öyle ya da böyle, istenen hücre işgal edilecek. Böylece birinci oyuncunun tahtada fazladan bir taşı olur, ona müdahale edemez, sadece rakibinin bu hücreyi işgal etmesine engel olur. Bu nedenle, ilk oyuncu tarife göre kareleri işgal edebilir ve kazanması gerekir. Bu, ikinci oyuncunun kazanabileceği orijinal varsayımıyla çelişir ve bu nedenle bu varsayım yanlıştır, yani kazanabilmesi gereken ilk oyuncudur.
Matematiksel sadelik yanlılarının bu ispatları katı bulmaları pek olası değildir. Merak uyandıran bir detay daha: Teorem II'nin ispatı yapıcı değil . Yani prensipte kazanabileceğini söylese de birinci oyuncuya kazanma yöntemini göstermez. Yapıcı bir ispat örneği daha sonra verilecektir. Ve şimdi teoremlerin ne olduğu ve neden kanıtlanmaları gerektiği konusunda biraz felsefe yapmak fena bir fikir olmaz.
Herhangi bir problemin kesin formülasyonu, matematiksel teoremlerin öncüllerini içerir. Altıgen oyununun kuralları formüle edildikten sonra, tıpkı Öklid geometrisinin teoremlerinin aksiyomlarının zorunlu bir sonucu olması gibi, zorunlu olarak ilk oyuncunun kazanabileceğini ima ederler.
Yeterli zeka ve sezgi ile teoremin doğruluğu hemen görülebilir. Genç Newton'un Öklid geometrisinin teoremlerini apaçık kabul ettiği ve onları kanıtlamaya dayanamadığı söylenir.
Matematikçiler genellikle bir önermenin doğruluğundan şüphelenebilir veya tahmin edebilirlerse de, emin olmak için her zaman teoremleri kanıtlamaları gerekir. Newton ispatın önemini kendisi anladı ve Öklid'in yöntemlerini kullanarak birçok yeni teorem çıkardı.
Yanılmaz bilgi, matematikçilere birdenbire gelmez. Yavaş yavaş, adım adım, bir teoremi birbiri ardına zahmetli bir şekilde kanıtlayarak bilgiye yaklaşırlar. Dahası, başkalarını doğruluğuna ikna etmek için teoremleri de kanıtlamak zorundadırlar.
Bazen bir matematikçi, sağduyuya aykırı gibi görünebileceğinden, doğruluğuna kendini ikna etmek için bir teoremi kanıtlamak zorundadır. Örnek olarak aşağıdaki sorunu ele alalım. Kenarı 1 cm olan bir kare var (Şek. 1.4). Bu karenin herhangi bir noktası iki sayı kullanılarak belirtilebilir: y (noktanın karenin tabanının üzerindeki yüksekliği) ve x (noktanın karenin sol tarafından uzaklığı). Bu sayıların her biri birden az olacaktır. P noktası olsun aşağıdaki koordinatlara sahiptir: a: \u003d 0,547000 ... (sonsuz bir sıfır dizisi izler).
y = 0.312000 . .. (sonsuz bir sıfır dizisi vardır).
Karenin noktalarına bir düz çizgi parçası üzerinde noktalar atandığını ve parça üzerindeki her noktanın karenin yalnızca bir noktasına karşılık geldiğini ve karenin her noktasının parça üzerinde yalnızca bir noktaya karşılık geldiğini varsayalım. Eğer öyleyse, o zaman bir karenin bir parça üzerinde bire bir eşlemesini elde ettiğimizi söyleriz .
teorem. Birim alanın bir karesi, birim uzunluktaki bir parçaya bire bir eşlenebilir .
Kanıt. Bir y sayısı alın ve bu sayının ilk basamağı x'in birinci basamağı , ikinci basamağı üçüncü, üçüncü basamağı beşinci vb. olsun. Sonra X sayısını alın. ( P noktası mesafesi segmentin sol ucundan) ve bu sayının ilk basamağı x' 9'un ikinci basamağı olsun ikincisi dördüncü, üçüncüsü altıncı, vb. x , P r noktasının uzaklığı olacak segmentin sol ucundan. Sonra nokta P r P noktasının bire bir eşlemesi olacak kesmek için kare. Açıktır ki, x ve y değiştiğinde a / değişecek ve x değiştiğinde , x ve y değişecektir . Karenin her x, y noktası , parçanın yalnızca bir x' noktasına karşılık gelir ve her x f noktası segment, bire bir yazışma gereksinimini karşılayan karenin yalnızca bir x, y noktasına karşılık gelir .
Yukarıdaki örneği kullanarak i = 0,547000 ..., y = 0,312000 ...,
√=0,351427000 ...
Çoğu noktanın sonsuz bir rakam dizisinden oluşan sayılarla temsil edildiğine ve bu dizinin bir sıfır dizisi haline gelmediğine ve asla tekrarlanmadığına dikkat edilmelidir.
Burada yapıcı bir ispat örneğimiz var. Bunun nasıl yapılacağına dair kesin bir tarif vererek, bir karenin her noktasını bir parça üzerindeki bir noktaya bire bir eşlemenin mümkün olduğunu gösterdik. Pek çok matematikçi yapıcı kanıtları yapıcı olmayanlara tercih eder ve sezgi okulunun matematikçileri, bazı özellikler için kümenin her bir öğesini ayrı ayrı incelemenin imkansız olduğu sonsuz kümeleri düşünürken genellikle yapıcı olmayan kanıtları reddederler.
Şimdi bir karenin noktalarını bir doğru parçasına eşlemenin başka bir özelliğini inceleyelim. Bir işaretçinin parça boyunca hareket ettiğini ve ikinci işaretçinin birinci işaretçiyle aynı anda karenin yüzeyi boyunca hareket ettiğini hayal edin. İkinci işaretçi, o anda birinci işaretçi tarafından gösterilen parçanın noktalarına karşılık gelen karenin noktalarını gösterir. İlk ibre yavaş ve düzgün hareket ettiğinde, ikinci ibre karenin yüzeyi boyunca yavaş ve düzgün bir şekilde hareket edecek gibi görünebilir (bunun böyle olmadığını daha sonra kanıtlayacağız). Görünüşe göre, segmentin birbirine çok yakın yerleştirilmiş tüm noktaları, karenin yüzeyinde çok yakın noktalara da karşılık gelecek. İlk işaretçiyi parça boyunca küçük bir mesafe hareket ettirirsek, ikinci işaretçi de karenin yüzeyi boyunca küçük bir mesafe hareket eder ve eğer birinci işaretçi daha da küçük bir mesafe hareket ettirilirse, o zaman ikinci işaretçi daha küçük bir mesafe hareket eder. mesafe, vb. e. Durum böyle olsaydı, bir karenin noktalarının bir parça üzerindeki noktalara bire bir eşlenmesinin sürekli olduğunu söyleyebiliriz.
Bununla birlikte, bir karenin noktalarının bir parça üzerindeki noktalara bire bir eşlenmesinin mümkün olmadığı ortaya çıktı.
sürekli. Bir kareye ait bir eğri boyunca hareket ettiğimizde, bu eğrinin bir parçaya eşlenen noktaları kesinlikle rastgele dağılmış olacak ve bu sadece açıklanan haritalama yöntemi için değil, aynı zamanda karşılıklı olarak herhangi biri için de geçerli olacaktır. net gösterim. Bir karenin bir çizgi parçasına bire bir eşlenmesi süreksizdir.
teorem. Bir karenin bir çizgi parçası üzerindeki bire bir eşlemesi süreksiz olmalıdır.
Kanıt. Bire bir eşlemenin sürekli olduğunu varsayalım. Sonra bir AB eğrisine ait tüm noktalar (Şekil 1.5) karşılık gelen A r noktaları arasında bulunan noktalara eşlenmelidir. ve B'. Bu noktalar arasında düşmezlerse, eğri boyunca hareket ederken, ya parçanın bir ucundan diğerine atlamamız (süreksiz bir eşleme) ya da parçanın aynı noktasından iki kez geçmemiz (eşleme) gerekirdi. bire bir değildir). Keyfi bir nokta seçiyoruz C r A' B f segmentinin solunda ve D r noktası A'B'nin sağına ve C karesinin karşılık gelen noktalarını bulun ve D. C noktaları arasında çizim yapın ve D AB eğrisiyle kesişecek şekilde eğri . Kesişim noktasında, AB \ eğrisi ile ortak bir noktaya sahip olacaktır, bu nedenle, CD eğrisinin bu noktası A' ve B' arasındaki bir noktaya ve AB 1 eğrisine ait olmayan diğer tüm noktalara eşlenmelidir. A'B' dışındaki noktalara eşlenmelidir . Bu, eşlemenin sürekli olduğu ve dolayısıyla eşlemenin sürekli olamayacağı varsayımıyla çelişir.
Daha sonra bir karenin noktalarını bir doğru parçasına eşleme olasılığına ilişkin teoremin ve böyle bir eşlemenin süreksizliğine ilişkin teoremin bilgi kuramı için önemli olduğunu ve tarafımızdan kullanılacağını göreceğiz; hex teoremleri kullanılmayacaktır.
Matematik, eldeki görevde gizli olan ve hemen belli olmayan belirli hükümleri kademeli olarak açıklama yöntemidir. Genellikle, matematiği kullanarak, kişi önce bu önermeleri bulmalı ve ardından bir ispatla doğrulamalıdır. Burada kilit bir sorunla karşılaşıyoruz: geçmişin matematikçilerini tatmin eden kanıtlar, çoğu zaman modern matematikçileri hiç tatmin etmiyor.
c, А׳ Bt Df
Resim. 1.5.
Her nasılsa, sinirli ve pek öne çıkmayan bir matematikçi, Shannon'ın "Matematiksel İletişim Teorisi" adlı çalışmasına ilişkin incelemesinde, yazarın matematiksel kanıtlarının kesinliğinden şüphe duydu. Yine de, Shannon'ın teoremleri doğrudur ve verilen ispatlar, titizliğiyle ünlü matematikçileri bile tatmin edecek şekildedir. Matematiksel yöntemleri göstermek için yukarıda verdiğim basit ispatlar tamamen titiz değildir ve püristler tarafından eleştirilebilir. .
• Bu bölümde matematiksel akıl yürütmenin doğasını açıklamaya ve bir teoremin ne olduğu ve nasıl kanıtlanabileceği hakkında fikir vermeye çalıştım. Bunu kavradıktan sonra, iletişimin matematiksel teorisine, onun artık kanıtlamayacağımız teoremlerine ve ayrıca matematiksel kesinlik ile kurulabilecek olanın çok ötesine geçen ilgili yönlere geçeceğiz.
Yukarıda söylediğim gibi, Shannon tarafından ifade edildiği biçimdeki bilgi teorisi, iletişim ve bilgi aktarımı ile ilgili bazı önemli soruları çok geniş ve soyut bir şekilde ele alır, ancak bu, iletişim kelimelerinin her yerde uygulanabileceği anlamına gelmez. ve iletişim , pek çok gündelik anlamlarıyla bilgi meydana gelir . Bilgi teorisi, iletişimin yalnızca genelleştirilebilen ve genelleştirmenin mantıklı olduğu yönleriyle ilgilenir, tıpkı Newton yasalarının Aristoteles'in hareket kelimesini kullanarak temelde farklı olan tüm fenomenlerle değil, yalnızca mekanik hareketle ilgilenmesi gibi .
Başarılı bir şekilde gelişmek için bilim mümkün olan her şeyi denemelidir. Ortak kelimelerin kullanıldığı olguları ve kavramları birleştirmenin mümkün olduğuna inanmak için hiçbir nedenimiz yok. Genel, kelimelerde değil, ∏πfτx l' de aranmalıdır. bizim deneyimimizde. Olgular arasındaki ilişkiyi kurmayı başardığımızda bir teori elde ederiz. Newton'un hareket yasaları, mekanik olayların incelenmesinde kullanılabilecek bir teoridir. Maxwell denklemleri, elektriksel olayların incelenmesinde kullanılabilecek bir teoridir. Devre teorisi, basit elektriksel veya mekanik elemanlardan oluşan sistemleri incelemek için kullanılabilir . Aritmetik kullanılabilir x insan, taş, yıldız vb. sayılarını sayarken ve Dünya, deniz veya galaksileri ölçerken geometri.
Belirli fiziksel olgularla ilgilenen Newton'un hareket yasaları ve Maxwell denklemlerinin aksine, bilgi kuramı soyuttur çünkü yazılı, akustik veya elektriksel birçok iletişim biçimine uygulanabilir. Bu teori, iletişimin önemli ama soyut yönleriyle ilgilenir. Açık ve kesin varsayımlardan bilgi kaynaklarına ve iletişim kanallarına ilişkin teoremlere geçer. Bu, onu esasen matematiksel kılar ve onu anlamak için, bir teoremin kanıtlanması gereken bir ifade olduğu fikrini kavramak, yani belirli bir ifadenin bir dizi ilk varsayımın zorunlu bir sonucu olduğunu belirlemek gerekir. Bu düşünce matematiğin kalbidir.
İkinci bölüm
kökenler
Tarih farklı algılanıyor. Bazıları, kaçınılmaz gelişiminde yalnızca geçmişi değil, aynı zamanda geleceğin bir prototipini de görebileceğiniz bir tür evrensel dünya sistemi bulmak için eski zamanları inceler. Diğerleri şimdiki zamanda başarının sırrını bulmak için geçmişe bakar. Örneğin bazıları, geçmişte yapılan bilimsel keşiflerin deneyimiyle kişinin yenilerini yapmayı öğrenebileceğine inanır. Bazı bilgeler düşünceli bir şekilde tarihten sadece ders aldığımızı, ondan hiçbir şey öğrenmediğimizi söyledi ve Henry Ford - doğrudan tarihin biraz olduğunu belirtti.
Bütün bunlar benden ve kitabımın konusundan uzak. Yine de bilim tarihinden en az iki sonuç çıkarılabileceğini söylemek isterim.
İlk sonuç, en genel ve çarpıcı bilimsel keşiflerin doğal koşullarda değil, fenomenlerin insan eliyle veya dilerseniz teknolojiyle yaratılan cihazlarda incelenmesi sonucunda yapıldığıdır. Bunun nedeni, insanın makinelerde veya cihazlarda yeniden ürettiği olayların, doğal olanlara göre basit ve düzenli olması ve anlaşılmasının çok daha kolay olmasıdır.
Böylece, ısı, basınç, buharlaşma ve yoğuşma ile ilişkili fenomenlerin basit ve düzenli bir biçimde meydana geldiği bir buhar motorunun yaratılması, çok güçlü ve genel bir bilim olan termodinamiğin gelişmesi için ana teşvik görevi gördü. Bu, özellikle Carnot'nun çalışmasında iyi bir şekilde örneklenmiştir . Aerodinamik ve hidrodinamik konusundaki bilgimiz, esas olarak kuşların ve balıkların davranışlarına ilişkin gözlemlere değil, yalnızca uçak ve gemi yapımının hızlı gelişimine bağlıdır. Elektrik bilgimizin çoğu şimşek çakmalarından değil, insan icatlarından gelir.
Benzer şekilde, Shannon tarafından oluşturulan geniş ve zarif iletişim teorisinin köklerini telgrafın basit ve anlaşılır fenomeninde göreceğiz.
Tarihin bize öğretebileceği ikinci şey, anlamanın zorluğudur. Bugün, Newton'un yasaları basit ve neredeyse açık görünüyor, ancak bu yasaların hiç kimsenin hayalini kurmadığı zamanlar, en önde gelen insanların hareketin ne olduğuna dair çok belirsiz bir fikre sahip olduğu zamanlar oldu. Kaşiflerin kendileri bile bazen bize inanılmaz eksantrik görünüyor. Maxwell'in elektrik ve manyetizma üzerine yazdığı incelemesinde keşfini doğrudan ve cesurca ilan edeceği düşünülüyordu. Ve inceleme, bir zamanlar önemli görünen o kadar çok küçük soru yığınıyla doludur ki, deneyimsiz bir okuyucu, onu artık tanıdık terimlerle anlamak için uzun süre keşif yapmak zorunda kalır. Doğru, Maxwell daha sonra fikirlerini oldukça açık bir şekilde açıkladı.
Dolayısıyla, bilimsel fikirlerin kökenini incelemek, bu kadar güçlükle yapılan keşifleri biraz daha takdir etmemize yardımcı olacaktır. Geçmişte araştırmacıların, kesin bir adım atamayarak keşfin tam eşiğinde nasıl durduklarını sık sık okuruz. Hatta bazen onlara yardım etmek, önermek isteriz; çünkü karara çok yaklaşmışlardı ve gerçekten de ana sonuca varmaları gerekirdi. Ancak ne yazık ki bu, birçok insanın kişisel yaşamlarında düştüğü tuzağın aynısıdır. Hakkında yalnızca en genel fikre sahip olduğunuz bir sorunu çözerken, genellikle her şeyin sonuna kadar açık olduğunu düşünürsünüz.
Dolayısıyla fikrin nasıl doğduğunu, ortaya çıkmadan önce nelerin bilindiğini, netlik ve bütünlüğün nasıl sağlandığını ne kadar iyi anlarsak, gerçek içeriğini anlamak o kadar kolay olacaktır. Ancak bunun için, yapılması gereken veya yapılabileceği yolu değil, gerçek keşif yolunu izlemek ve ona (eğer yapılabilirse) modern bir insanın değil, gözlerinden bakmaya çalışmak gerekir. o günlerde yapılabileceği şekilde.
Matematiksel iletişim teorisinin kökenlerini araştırmak, aşılmaz bir bataklığa yol açabilir. Bundan tamamen kaçınmak isterdim, ancak diğer yazarlar sürekli olarak okuyucularını bu yola iterler. Umarım burada verdiğim rehber sayesinde okuyucu yine de yara almadan kurtulabilir.
entropi adı verilen belirli bir niceliği kullanır . Bu kavram aynı zamanda matematiksel iletişim teorisinde veya bilgi teorisindedir. Ancak termodinamik ve istatistiksel mekanik, bilgi teorisinden daha eskidir. Ayrıca 1929'da yayınlanan bir makalede L. Szilard, fiziksel bir paradoksu çözmek için bilgi kavramını uyguladı. Buradan bilgi teorisinin bir şekilde istatistiksel mekanikten çıktığı sonucuna varılabilir.
Bu basit ama çelişkili düşünce uzmanların bile kafasını karıştırdı. Aslında, matematiksel iletişim teorisi, telekomünikasyonun bazı problemlerini çözme girişiminin bir sonucu olarak ortaya çıktı. İletişim teorisindeki entropi, yalnızca istatistiksel mekanikte kullanılan entropi ile matematiksel benzetme nedeniyle böyle adlandırıldı . Ancak bu iki kavramın içeriği tamamen farklıdır.
Termodinamikte, enerji gibi belirli bir gaz miktarının entropisi, ne tür bir gaz olduğunun yanı sıra sıcaklığına, hacmine ve kütlesine bağlıdır. Isı yalıtımlı bir silindire bir gaz yerleştirilirse ve bir pistonu iterek yavaşça genleşmesine izin verilirse, gaz soğumaya başlar ve termal enerjisinin bir kısmını kaybeder. Bu enerji, örneğin gazın kaybettiği enerjiyi depolayacak olan yükü kaldırmak için piston tarafından yapılan iş şeklinde kendini gösterecektir.
Bu süreç tersine çevrilebilir. Bunun anlamı şudur: İş, pistonu gazın basıncının tersi yönde yavaşça geri iterek ve bu şekilde orijinal durumuna sıkıştırarak yapılırsa, o zaman enerjisi, basıncı ve sıcaklığı tam olarak geri yüklenir. Böyle tersinir bir süreçte, enerji değişirken gazın entropisi sabit kalır.
Dolayısıyla entropi, sürecin tersine çevrilebilirliğinin bir göstergesidir. Entropi sabitse, süreç tersine çevrilebilir. Yukarıdaki örnekte, gazın ısıl enerjisi tekrar tekrar kaldırılan yükün mekanik enerjisine dönüştürülebilir ve bunun tersi de geçerlidir.
Fiziksel olayların çoğu tersinirlik özelliğine sahip değildir. Tersinmez olaylara her zaman entropide bir artış eşlik eder. Isı yalıtım silindirinin bir bölme ile ikiye ayrıldığını ve bölmenin bir tarafında gaz olduğunu diğer tarafında gaz olmadığını varsayalım. Ayrıca, gazın hacim boyunca yayılması için bölmenin aniden ortadan kaybolduğunu hayal edelim. Bu durumda termal enerji değişmeyecek, ancak entropi artacaktır.
Bölme kaldırılmadan önce, gazın termal enerjisi, gazı küçük bir cihaz aracılığıyla silindirin boş kısmına geçirerek hala mekanik enerjiye dönüştürülebiliyordu. Ve bölümü kaldırdıktan ve sonuç olarak entropide bir artış elde ettikten sonra, bunu artık yapamayız. Entropi arttığında ve enerji sabit kaldığında başka örnekler verilebilir. Bu, örneğin, ısı sıcak bir nesneden soğuk bir nesneye aktığında olur. Sıcaklık eşitlemesinden önce, sıcaklık farkını kullanarak iş yapmak hala mümkün olacaktır. Sıcaklık eşitlemesinden sonra, termal enerjinin bir kısmını mekanik enerjiye dönüştürmek artık mümkün değildir.
Bu nedenle, entropide bir artış, termal enerjinin mekanik enerjiye dönüştürülebilen kısmında bir azalma anlamına gelir. Entropinin artması, enerjinin kullanılabilecek kısmının azalması anlamına gelir.
Termodinamik entropi kavramını tanımlasa da, örneğin moleküllerin konumlarına ve hızlarına uygulandığı şekliyle fiziksel anlamını vermez. Bazı durumlarda, bu istatistiksel mekanik tarafından yapılır . Genel olarak entropinin fiziksel anlamı, entropinin artmasının düzenin azalması anlamına gelmesidir. Ama düzenlilik nedir diye sorarsanız , bu kelimenin anlamını bir ölçüde bilgi kelimesinin anlamı ile eşitlemek zorunda kalacaksınız . Her birinin konumu ve hızı biliniyorsa, çok karmaşık bir molekül dizilimi bile neredeyse hiç düzensiz olamaz. Düzensizlik, istatistiksel mekanikte kullanıldığı anlamda, moleküllerin konumları ve hızları hakkında bilgi eksikliğine dayanan öngörülemezliktir. Genellikle bu tür bilgilerin eksikliği, konumlar ve hızlar kümesi çok karmaşık olduğunda ortaya çıkar.
Silindirli örneğimize geri dönelim. Moleküller bölmenin bir tarafında olduğunda ve bunu bildiğimizde, entropi, moleküllerin bölmenin her iki tarafında dağıldığı duruma göre daha azdır. Doğal olarak, bölmenin bir tarafında olduklarını bildiğimizde moleküllerin konumu hakkında, silindirin içinde bir yerde olduklarını bildiğimizden daha fazla şey biliriz. Bir fiziksel sistemin durumuna ilişkin bilgimiz ne kadar ayrıntılı olursa, o kadar az belirsizlik (örneğin moleküllerin dizilişi) ve entropi o kadar az olur. Tersine, belirsizlik arttıkça entropi de artar.
Dolayısıyla fizikteki entropi, termal enerjiyi mekanik enerjiye dönüştürme olasılığı ile ilişkilidir. Bazı işlemler sırasında entropi değişmezse, bu işlem tersine çevrilebilir. Entropi artarsa, enerjinin kullanılabilecek kısmı azalır . İstatistiksel mekanikte, entropide bir artış, düzende bir azalma veya isterseniz sistem hakkındaki bilgimizde bir azalma olarak anlaşılır.
Verdiğim örnekler, fizikte entropinin ne olduğunu derinlemesine anlamak için açıkça yeterli değil, ama bana öyle geliyor ki, onun özü ve önemi hakkında yeterince konuştum.
Şimdi "entropi" kavramının bambaşka bir anlam kazandığı bilgi kuramında nasıl ve ne amaçla kullanıldığına bir göz atalım.
Matematiksel iletişim teorisinde, bir mesaj kaynağı olarak kabul edilir , örneğin, belirli bir durumda birçok olası mesajdan herhangi birini yaratabilen bir kişi . Bir mesajın taşıdığı bilgi miktarı, tüm olası mesajlardan hangisinin seçileceğine dair belirsizlik miktarı arttıkça artar. Olası on mesajdan biri, milyonda birinden daha az bilgi taşır. Matematiksel iletişim teorisindeki entropi, bu belirsizliğin bir ölçüsüdür ve bu belirsizlik veya (aynı olan) entropi, bir nicelik ölçüsü olarak alınır . Belirli bir kaynaktan mesaj taşıyan bilgi . Kaynak tarafından hangi mesajın üretileceği hakkında ne kadar çok şey bilinirse, o kadar az belirsizlik, daha az entropi ve daha az bilgi.
Gördüğünüz gibi “fizikte entropi” ve “matematiksel iletişim teorisinde entropi” kavramları tamamen farklı fikirlere dayanmaktadır ve her birinin bağımsız bir anlamı vardır. Bununla birlikte, bu entropilerin her ikisi de "belirsizlik" terimi kullanılarak benzer matematiksel ifadelerle tanımlanabilir. Ancak bu iki entropi arasında ve buna bağlı olarak fizik ile matematiksel iletişim teorisi arasında gerçekten bir bağlantı var mı?
Bazı matematikçiler ve fizikçiler, matematiksel iletişim teorisinin ve onun entropisinin istatistiksel mekanik için son derece önemli olduğunu kanıtlamayı çok isterler. Bu soru kafa karıştırıcı ve daha da kafa karıştırıcı. Bilgi kelimesinin birden fazla anlamı düşünüldüğünde bu karışıklık daha da artmaktadır . Bazen bilgi, örneğin, belirsizlik ve belirsizliğin çözümü ile değil, bilgi kelimesinin anlamının en yaygın kullanılan tonlarından biri olan bilgi ile ilişkilendirilir .
Bilgi kuramını biraz olsun anladığımızda , 10. Bölümde matematiksel iletişim kuramı ile fizik arasındaki ilişkiye bakacağız . Burada sadece matematiksel iletişim teorisi ile fiziği birleştirme girişimlerinin yararlı olmaktan çok merak uyandırdığını belirtmek isterim. Doğal olarak, bu girişimler boşa çıktı.
Matematiksel iletişim teorisi, istatistiksel mekanikten ziyade telekomünikasyon çalışmasından doğdu ve en önemli fikirlerinden bazıları, telekomünikasyonun emekleme döneminde olduğu zamana kadar uzanıyor.
1832'de transatlantik bir yolculuk yapan Samuel Morse, ilk elektrikli telgraf makinesini geliştirmeye başladı. Orijinal haliyle, Mors telgrafı şu anda bildiklerimizden çok daha karmaşıktı. Daha sonra bir kağıt bant üzerine kısa ve uzun çizgiler çizildi ve bu çizgilerin belirli bir dizisi bir harfi değil, bir sayıyı gösterdi. Her sayı, 1837'de Morse tarafından derlenen bir kod tablosundaki bir kelimeye karşılık geliyordu . Bu (daha sonra göreceğimiz gibi) verimli ama oldukça kaba bir kodlama yöntemidir.
Morse daha sonra Alfred Weil ile işbirliği içinde bu kodlama yöntemini terk etti ve 1838'de şimdi Mors kodu olarak bilinen yeni bir kod ortaya çıktı. Bu kodda, alfabenin harfleri duraklamalar, noktalar ve kısa çizgilerle temsil edilir. Duraklama, elektrik akımının olmamasıdır, nokta kısa akım darbesidir, kısa çizgi daha uzundur.
Alfabenin harfleri, nokta ve çizgi kombinasyonlarıyla çok ustaca karşılaştırıldı. Diğerlerinden daha kısa, tek bir nokta ile, İngilizce'de en yaygın olan E harfi belirtilmiş ve genel olarak, en yaygın harfler kısa nokta ve çizgi kombinasyonları ile gösterilmiş ve nadiren uzun harflerle karşılaşılmıştır. Çarpıcı bir şekilde, bu, İngilizce metindeki harflerin göreli tekrar sıklığı tablolarını kullanmadı ve bu tür tabloları derlemeye bile çalışmadı. Farklı harflerin göreli sıklığı, kasanın farklı kutularındaki harflerin basitçe sayılmasıyla tahmin edildi!
Sormaya hakkımız var: Noktalar, çizgiler, duraklamalar ve harfler arasındaki başka bir yazışma, metnin telgrafla daha da hızlı iletilmesine izin vermez mi? Modern teori
Посланный
Фиг. 2.1.
Hızda yaklaşık %15 kazanabileceğinizi söylüyor . Böylece Morse görevle başarılı bir şekilde başa çıktı ve alfabesi örneğinde, mesajları elektrik sinyallerine dönüştürme yönteminin ne anlama geldiğini görebilirsiniz. Bu tam olarak matematiksel iletişim teorisinin ana sorularından biridir.
1843'te ABD Kongresi, Washington ile Baltimore arasında bir telgraf hattının inşası için para tahsis eden bir yasa tasarısını kabul etti. Morse, kabloyu yeraltına döşemeye başladı, ancak daha sonra denizaltı telgraf hatlarının daha da büyük ölçüde zarar gördüğü zorluklarla karşılaştı. Direklere teller asarak sorunu çözdü.
Ancak Morse'un yeraltı hattını döşerken karşılaştığı zorluk devam etti. DC elektrik akımını eşit derecede iyi ileten farklı iletim hatlarının telekomünikasyon için uygun olmadığı ortaya çıktı. Noktalar ve çizgiler bir denizaltı veya yer altı kablosu üzerinden çok hızlı gönderilirse alıcı uçta birleşirler. Akımın keskin bir açılıp kapanmasıyla alınan kısa bir darbe gönderirseniz (Şek. 2.1), o zaman alıcı uçta akımın yükselişi ve düşüşü daha uzun olacak, yumuşatılacaktır. Darbe daha uzun olacak ve başka bir darbe ile çakışabilir (örn. akım yok). Dolayısıyla, net ve belirgin bir sinyal iletilse bile, akımın deşifre edilemeyen bazı anlaşılmaz artışları ve düşüşleri almak mümkündür (Şekil 2.2 ) <
Tabii ki noktalar, duraklamalar ve çizgiler yeterince uzunsa, o zaman alıcı uçtaki akım iletilen akıma daha yakın olacaktır, ancak bu aktarım hızını yavaşlatacaktır. Hattın özelliklerine bağlı olarak bazı sınırlayıcı iletim hızlarının olduğu açıktır. Sualtı hatları için bu hız son derece düşük ve telgraf operatörleri bu konuda çok endişeli ama havai hatlar için o kadar yüksek ki doğal olarak onları hiç rahatsız etmiyor. Zaten telgrafın şafağında, matematiksel iletişim teorisi için çok önemli olan bu sınırlama biliniyordu.
Hız sınırına rağmen, belirli bir süre içinde belirli bir hatta iletilebilecek mektup sayısını artırmanın yolları vardır. Kısa çizgi göndermek, nokta göndermekten üç kat daha uzun sürer. İki kutuplu telgrafın yardımıyla zamandan tasarruf sağlanabileceği çok geçmeden anlaşıldı. İlkesini anlamak için, alıcı uçta, telgraf teli ile toprak arasında, küçük akımları algılayan ve yönlerini gösteren bir galvanometrenin açıldığını hayal edelim. Bir noktayı iletmek için, pillerin artısı anahtarla tele, eksisi toprağa bağlanır. Bu durumda galvanometre iğnesi sağa dönecektir. Kısa çizgi iletirken, anahtar pilin eksi ucunu kabloya ve artıyı toprağa bağlar; galvanometre iğnesi sola döner. Başka bir deyişle, bir yöndeki (tele giren) akım bir noktayı ve diğer yöndeki (telden çıkan) akım ־ bir çizgiyi gösterir. Akımın tamamen yokluğu (akü bağlı değil) bir duraklama olduğunu gösterir. Mevcut iki kutuplu telgrafta galvanometre yerine çok çeşitli ekipmanlar kullanılmaktadır.
akım gönderildi
Kabul edilen akım
Resim. 2.2.
Tek kutuplu telgrafta kod iki öğeden oluşur: akım ve akım yok; onları 1 ve 0 olarak belirleyebiliriz . Çift kutuplu telgrafta üç unsur vardır: ileri akım veya tele yönlendirilen akım, akımın olmaması ve ters akım veya telden yönlendirilen akım. Bunları sırasıyla +1, 0, - 1 olarak gösterelim. Artı veya eksi işaretleri akımın yönünü, 1 rakamı ise akımın gücünü ifade eder ki bu durumda her iki yön için de aynıdır.
1874'te Thomas Edison daha da ileri gitti. Dörtlü (dörtlü) telgraf sisteminde sadece iki farklı yön değil, aynı zamanda iki farklı akım gücü de kullandı. Bir mesajı iletmek için yönünü değiştirmeden akımın gücünü değiştirmeyi ve başka bir mesajı iletmek için gücünü değiştirmeden akımın yönünü değiştirmeyi kullandı. Akımların aynı miktarda (örneğin, iki birim) farklı olduğunu varsayarsak, dört akımın tümü şu şekilde yazılabilir: +3, +1, -1 , -3 Alıcı uçtaki mesaj şu şekilde olabilir : sekmesi kullanılarak şifresi çözüldü. 1.
Alternatif dört farklı akım değeri kullanılarak iki bağımsız mesajın bu şekilde kodlanmasına bir örnek ŞEK. 2.3.
Açıkçası, hat boyunca iletilebilecek bilgi miktarı, yalnızca ardışık sembollerin (ardışık akım değerleri) iletilme hızına değil, aynı zamanda kaç farklı sembolün (farklı akım değerleri) seçileceğine de bağlıdır. dan. Sadece iki akım değeri +1 ve 0 veya aynı verimi veren +I ve -1 sembol olarak alınırsa , o zaman iki olası sembolden sadece biri belirli bir anda gönderilebilir.
Tablo 1
Включено
2 β
Выключено•
Включено
Выключено
Сообщение
birlikte , dört geçerli değerden herhangi birini (dört karakterden herhangi biri) seçmenin mümkün olup olmadığını zaten gördük, o zaman onların yardımıyla iki bağımsız bilgi parçasını iletmenin mümkün olduğunu gördük: ilkinde 0 veya 1 mesaj ve ikinci mesajda 0 veya 1 . Dolayısıyla, belirli bir sembol oranı için, dört akım iki bağımsız mesajı, iki akımın yalnızca bir mesaj gönderebildiği kadar hızlı gönderebilir. Dört geçerli değerle , dakikada iki değere göre iki kat daha fazla harf iletilebilir.
Çok sayıda karakter kullanmak zorluklara yol açabilir. Bir denizaltı kablosu üzerinden gönderilen noktaların ve çizgilerin gerildiğini ve bölündüğünü zaten belirtmiştik, böylece alıcı tarafta bir değil, birkaç karakter görüyoruz (bkz. Şekil 2.2 ). Bu koşullar altında, basit bir sembol sistemi olan 1, O veya +1, - 1'in öğelerini tanımak , daha karmaşık olana göre daha kolaydır : +3, +1, -I r -3.
Ancak karmaşık sinyalleri ayırt etme yeteneği, diğer fenomenlerle de sınırlıdır. Böylece, manyetik fırtınalar sırasında, telgraf hatlarında ve denizaltı kablolarında yan sinyaller ortaya çıkar . Ve daha yakından incelediğinizde, örneğin modern hassas elektronik amplifikatörlerin yardımıyla, kablolarda her zaman küçük istenmeyen akımlar olduğunu fark edeceksiniz. Bu fenomen, mikroskop altında gözlemlenebilen minik parçacıkların kaotik Brownian hareketine ve ayrıca hava moleküllerinin ve aslında ısı ve sıcaklık kavramıyla ilişkilendirdiğimiz diğer tüm maddelerin titreşimlerine benzer. Gürültü olarak adlandırılan yan akımlar her zaman mevcuttur ve iletilen sinyalin üzerine bindirilir.
Bu nedenle, semboller arasındaki karşılıklı girişimi, yani noktaların ve duraklamaların birleştirilmesinden kaçınmak mümkün olsa bile, gürültü yine de alınan sinyali bozacak ve semboller arasında ayrım yapmayı zorlaştıracaktır. Elbette akımı ve dolayısıyla iletilen sinyalin gücünü artırarak gürültünün etkisinin üstesinden gelmek mümkündür. Ancak burada da sınırlamalar var. Bir denizaltı kablosundan büyük bir akım iletmek için büyük bir akım gerekir ve bu, kablo yalıtımını bozabilir ve kısa devreye yol açabilir. 1858'de ilk transatlantik telgraf kablosunun hasar görmesine neden olanın yüksek voltaj olması muhtemeldir .
İlk telgraf operatörleri bile, gürültünün veya girişimin, sinyalleri ayırt etmenin zorluğunun yanı sıra izin verilen maksimum gücün iletim hızını sınırladığını sezgisel olarak oldukça iyi anladılar. Ancak, gerekli olan sezgi değil, daha fazlasıydı. Titiz bir matematiksel analize ihtiyaç vardı.
Matematik, bu tür problemlerin çözümü için oldukça uzun zaman önce uygulanmaya başlandı, ancak ancak son yıllarda tam bir çözüm elde edildi. 1855'te , daha sonra Lord Kelvin olan William Thomson, bir denizaltı kablosu boyunca bir nokta veya duraklama iletilirse, alınan akımın biçiminin tam olarak ne olacağını hesapladı. Bu sorunlara karşı daha da güçlü bir saldırı, 1875'te Alexander Graham Bell tarafından telefonun icadıyla başladı . Telgrafta açma-kapama tipi sinyaller kullanılıyorsa ve iletim hızları düşükse, telefonda gücü sorunsuz değişen ve oldukça geniş bir aralıkta herhangi bir değeri alabilen akımlar kullanılır ve akım gücündeki değişim oranı, manuel bir tele - sürahinin hızından birkaç yüz kat daha fazladır.
Birçok bilim adamı, telefon fenomeninin matematik diline çevrilmesine yardımcı oldu. Aralarında en önde gelenleri, büyük Fransız matematikçi Henri Poincaré, biraz daha az yetenekli eksantrik İngiliz Oliver Heaviside, From Immigrant to Inventor'ın ünlü yazarı Michael Pyunin ve American Telephone and Telegraph Co.'dan Campbell idi.
19. yüzyılın başında ısının yayılmasını inceleyen Fransız fizikçi ve matematikçi Joseph Fourier tarafından yürütülen çalışmanın devamıydı . Salınımların incelenmesinde kullanılan bu yöntemler, telefon ve telgraftaki akımların değişimi gibi zamanla karmaşık bir şekilde değişen elektrik akımlarının analizi için mükemmel bir şekilde uygundur.
Hikayemize devam etmeden önce, Fourier'nin matematiğe katkısının anlamını en azından biraz açıklığa kavuşturalım, çünkü genel olarak iletişimin ve teorisinin bu fikirler olmadan nasıl gelişeceğini hayal etmek imkansızdır. Neyse ki, ana fikirler basit ve karmaşık ispatlara ve uygulama çılgınlığına girmeyeceğiz.
, sinüsoid adı verilen matematiksel bir fonksiyon kullanarak ısı transferi sorunlarının matematiksel bir çalışmasını yürüttü . Sinüzoidin bir bölümü, Şekil 2'nin sağ tarafında gösterilmiştir. 2.4. sinüzoidal yükseklik h zaman içinde sorunsuz bir şekilde değişir ve bu dalgalanmalar sonsuzdur. Bir sinüzoidin başlangıcı veya sonu yoktur. Bu sadece düzgünce kıvrılan bir eğri değil. Yüksekliği (yüksekliği akım gücünü veya gerilimi temsil edebilir) zaman içinde oldukça kesin bir şekilde değişir. Bu değişiklik, Şekil 2'nin sol tarafında gösterildiği gibi, sabit bir hızla dönen bir mil üzerine monte edilmiş bir kolun hareketi dikkate alınarak açıklanabilir. 2.4. Sapın şaftın h ekseni üzerindeki yüksekliği , zamanla kesin olarak sinüzoidal olarak değişir.
Sinüzoid, zaman içinde oldukça basit bir değişim şeklidir. Bir sinüsoid diğerinden üç değerle farklıdır. Bunlardan biri genlik veya maksimum yükseklik, diğeri faz veya maksimuma ulaşıldığı an, üçüncüsü periyot veya maksimumlar arasındaki T zamanıdır .
frekans denilen ve / harfi ile gösterilen bunun karşılığı kullanılır . T periyodu ise 1/100 sn ise frekans
Zaman
Resim. 2.4.
IOO hertz (Hz) veya bir tepeden diğerine saniyede 100 tam döngü. Sinüzoid periyodiktir, çünkü bir tam salınım diğerinden farklı değildir.
Fourier, şüpheci çağdaşlarını kelimenin tam anlamıyla hayrete düşüren bir teoremi kanıtlamayı başardı. Belirli bir miktarda zamandaki herhangi bir değişikliğin, farklı genliklere, fazlara ve frekanslara sahip bir dizi sinüzoidal salınımın toplamı olarak temsil edilebileceğini gösterdi. Bu miktar, titreşen bir sicimin yer değiştirmesi, kabaran bir okyanusun yüzeyindeki dalgaların yüksekliği, bir elektrik demirinin sıcaklığı, bir telefon veya telgraf telindeki akım veya voltaj olabilir. Fourier analizine her şey uygundur. Böyle bir analizin basit bir örneği Şekil 1'de gösterilmektedir. 2.5. Periyodik eğri a, iki sinüzoidin toplamıdır b ve s.
Bir dizi basit sinüzoidal salınımın toplamı gibi herhangi bir fiziksel miktarın zamandaki karmaşık değişiminin bu kadar basit bir temsili, sadece matematiksel bir numara gibi görünebilir. Ama bu bir numara değil; böyle bir temsilin kullanılması iki önemli fiziksel özelliğe bağlıdır. Elektrik sinyallerini iletmek için kullanılan devrelerin parametreleri zamanla değişmez ve lineerlik denilen özelliği vardır. Örneğin, aşağıda giriş sinyali olarak adlandırılacak olan hat boyunca bir sinyal gönderelim ve bunun zaman içindeki değişiminin bir eğrisini çizelim. Daha sonra hatta ikinci bir giriş sinyali göndeririz ve karşılık gelen alınan sinyali çizeriz. Şimdi bu iki sinyalin toplamını, yani her andaki akımı iki farklı giriş sinyalinin akımlarının toplamına eşit olan bir sinyali gönderelim. Sonra kabul edildi
(Çıkış) sinyali, gönderilen iki bölüme ancak giriş sinyallerine karşılık gelen iki çıkış sinyalinin toplamı olacaktır.
İletişim devrelerinin parametrelerinin zaman içinde önemli ölçüde değişmediğini varsaymak oldukça kolaydır. Doğrusallıkla, basitçe, ayrı ayrı gönderilen herhangi bir sayıda giriş sinyaline karşılık gelen çıkış sinyallerinin şeklini biliyorsanız, o zaman birkaç giriş sinyali aynı anda gönderildiğinde, karşılık gelen çıkış sinyallerini ekleyerek çıkış sinyalinin şeklini hesaplayabileceğiniz anlamına gelir. Doğrusal bir iletim hattında veya bir iletim sisteminin devrelerinde, sinyaller birbirinden bağımsız varmış gibi davranırlar, etkileşmezler. devre lineer kabul edilir.
Doğrusallık, doğanın şaşırtıcı bir özelliği olmasına rağmen, kesinlikle alışılmadık bir durum değildir. Dirençler, kapasitörler ve endüktanslardan oluşan tüm devreler doğrusaldır; Telgraf hatları ve kabloları aynı özelliğe sahiptir. Elektronik tüpler, transistörler veya diyotlar içermiyorsa hemen hemen her elektrik devresi doğrusaldır ve bazen bu tür devreler neredeyse doğrusal olarak kabul edilebilir.
[Telgraf telleri doğrusallık özelliğine sahip olduğundan, yani kablolar boyunca yayılan elektrik sinyalleri etkileşmediğinden, bir ve aynı
Aynı tel üzerinde, zıt yönlerde aynı anda iki sinyal iletilebilir ve karşılıklı girişim meydana gelmez. Ancak doğrusallık, elektrik devrelerinde oldukça yaygın olsa da, hiçbir şekilde doğanın evrensel bir özelliği değildir. İki tren aynı hat üzerinde çarpışmadan birbirine doğru gidemez. Ancak trenlerdeki tüm fiziksel olayların doğrusal olduğu ortaya çıkarsa, böyle bir durum mümkün olabilir. İnsanlığın sefil kaderine gelince, eğer o doğrusal bir yolda çürüyecekse, bırakın okuyucular boş zamanlarında kendileri için düşünsünler.
Şaşırtıcı lineerlik özelliğine hakim olduktan sonra, elektrik devreleri aracılığıyla sinyal iletimi konusuna dönelim. Çoğu durumda çıkış dalga biçiminin giriş dalga biçiminden farklı olduğunu daha önce belirtmiştik. Bu, şekilde gösterilmiştir. 2.1 ve 2.2. Bununla birlikte, matematik yardımıyla gösterilebilir (bunu burada yapmayacağız), giriş sinyali olarak bir sinüzoidi alıp doğrusal bir devre üzerinden iletirsek, o zaman çıkışta her zaman aynı sinüzoidi alacağız. periyot ve dolayısıyla , aynı sıklıkta. Ancak çıkıştaki sinüzoidin genliği, giriş sinüzoidinin genliğinden daha az olabilir; buna sinüzoidal sinyalin zayıflaması (zayıflaması) denir . Ayrıca, çıkış sinüs dalgası, giriş sinüs dalgasından daha sonra zirve yapabilir; buna faz kayması veya sinüzoidal sinyalin gecikmesi denir .
Zayıflama ve gecikme miktarı sinüzoidin frekansına bağlıdır. Devre, bazı frekansların sinüsoidlerini hiç geçemeyebilir. Böylece, giriş ve çıkış sinyalleri aynı sinüzoidal bileşenleri içerecektir , ancak çıkış sinyali bileşenlerinin fazları ve genlikleri, giriş sinyali bileşenlerinin fazları ve genliklerinden farklı olacaktır. Böylece, çıkış dalga biçimi giriş dalga biçiminden farklı olacaktır. Ancak bu fark, frekansa bağlı olarak çıkış sinyalinin bileşenlerinin faz ve genliklerindeki değişikliklerle tam olarak açıklanabilir. Zayıflama ve gecikme tüm frekanslarda aynıysa, çıkış dalga biçimi giriş dalga biçimiyle eşleşecektir; böyle bir devreye bozulmayan denir .
Bu soru çok önemli, bu yüzden bunu şekil 1 ile örneklendirdim. 2.6. Giriş sinyali a, 48 olarak temsil edilebilir.
iki sinüzoidal bileşenin toplamı b ve c. Dalga b iletim sırasında zayıflamaz veya gecikmez, dolayısıyla çıkış dalgası b , b ile aynı frekans , S b ile çakışıyor . Ve c dalgasından elde edilen çıkış dalgası c' hem zayıflatılır hem de geciktirilir. Açıktır ki, çıkış sinyali I c , ( a! ve b'nin toplamı ) şekil olarak giriş sinyalinden farklıdır a. Ancak yine de hem giriş hem de çıkış sinyalleri iki bileşen içerir ve bu bileşenlerin ן frekansları aynıdır. Bileşenler faz ve genlik bakımından farklılık gösterir.
[ Fourier açılımı, herhangi bir geçişin geçişini incelemenizi sağlar.
sinüse maruz kalan zayıflama ve faz kayması değerleri biliniyorsa, lineer bir devre boyunca byh sinyalleri; Bu devreden geçerken farklı frekanslardaki sinyaller.
Fourier açılımı, sinyal iletiminde ortaya çıkan sorunları çözmek için güçlü bir araçtır. Onun yardımıyla matematikçiler ve mühendisler, ilk başta doğru bir şekilde anlaşılmayan birçok çelişkili sonuç aldılar. Böylece, ilk telgrafçılar, istenen özelliklere sahip olduğu varsayılan her türlü sinyal biçimini ve kombinasyonunu keşfettiklerini iddia ettiler, ancak çoğu zaman matematiksel hesaplamalarının hatalı olduğu ve argümanlarının saçma olduğu ortaya çıktı. İletim gücünü sınırlamak, maksimum iletim hızını artırmak, karşılıklı girişimi azaltmak ve gürültüyü azaltmak açısından hangi sinyallerin en etkili olduğu konusunda birçok tartışma vardı.
1917'de Harry Nyquist, doktora derecesini aldıktan sonra (o günlerde doktoralar bugün olduğundan çok daha nadirdi), American Telephone and Telegraph Co.'da çalışmaya başladı. Nyquist, matematiği telgraf problemleriyle mücadele edenlerin çoğundan daha iyi biliyordu ve iletişim problemleriyle ilgili çalışmalarının mantıksal derinliği, netliği ve orijinalliğiyle hala dikkat çekicidir. Güçlü araştırma yöntemleriyle donanmış ve doğuştan gelen içgörüye başvurarak enerjik bir şekilde telgrafın sorunlarını çözmeye koyuldu. Araştırmasının sonucunu 1924 yılında "Telgraf sinyallerinin iletim hızına etki eden bazı * faktörler" adını verdiği çok önemli bir eserde yayımladı. İçinde telgrafın bir dizi problemini ele aldı. Bu arada, sinyal iletim hızı ile iletimde kullanılan akım değerlerinin sayısı arasındaki ilişki burada açıklığa kavuşturuldu: +1, ~ 1 (iki akım değeri) veya
Tablo 2
43 - , 1 - , 1 + , 3 ־ (dört geçerli değer). Nyquist, sembolleri (ardışık akım değerleri) sabit bir oranda gönderirseniz, baud hızının W olduğunu söylüyor. bağımlılıkla farklı sembollerin sayısı m ile ilgilidir
W=klogm 1
burada k, ardışık akım değerlerinin iletilme hızı tarafından belirlenen sabit bir değerdir. Sağ tarafta duran log t ifadesi çeşitli nedenlerle alınabilir . 2 sayısını temel alırsak , m'nin çeşitli değerleri için Iog m Tablo'dan bulunabilir. 2 ♦.
2 tabanlı logaritma nedir, şu şekilde tanımlanabilir: Iog X öyle bir numara var ki
, 2 10gx = z.
Denklemin her iki tarafının logaritması alınırsa aşağıdaki bağıntı elde edilir:
10g2 10gx = 10gz.
Iog x yerine M י koyarsak , o zaman şunu göreceğiz
günlük 2 m = M.
Bütün bunlar Tablo ile uyumludur. 2.
Nyquist ilişkisine neden başka bir fonksiyonun değil de logaritmanın girdiğini anlamanın kolay olduğu bir örnek verelim. Açık-kapalı veya 0-1 tipi olası durumlardan aynı anda iki bağımsız seçim yapıldığını varsayalım. Tablodan görülebileceği gibi. 3, iki bağımsız O - 1 seçeneğinin dört kombinasyonu mümkündür ve eğer aynı anda üç bağımsız seçim yapılırsa, o zaman sekiz kombinasyon olacaktır (Tablo 4).
Aynı şekilde akıl yürüterek, dört bağımsız seçim yapılırsa on altı kombinasyon olacağını ve son olarak M bağımsız seçim yapılırsa 2 m farklı kombinasyon olacağını görüyoruz .
m sayısının logaritmasının 2 tabanında , Iog 2'de kabul edilen tanımı yerine m, log m kısaltması kullanılır.Burada sadece 2 tabanına göre logaritmalar kullanıldığı için bu yanlış anlaşılmalara yol açmaz ; başka bir temeli kullanmanın nadir örnekleri not edilmiştir.— Not. ed.
Tablo 3
M belirtebilirseniz aynı anda 0 - 1 tipi bağımsız kombinasyonlar , bu aslında M gönderebileceğiniz anlamına gelir bağımsız mesajlar ve tabii ki iletim hızı M ile orantılı olacaktır. Ancak M'yi aynı anda iletmek için mesajlar, 2 m farklı karakter gereklidir , çünkü olası kombinasyonların sayısı M bağımsız seçimler 0-1 eşittir 2m . Nyquist, 2m sembol olduğunu varsayarak , maksimum bit hızını elde etmek için sembol sayısının 2 tabanlı logaritmasının alınması gerektiğini söylüyor.
kütük 2 m = II.
Böylece, karakter sayısının logaritmasının, aynı anda yapılabilecek bağımsız 0-1 seçimlerinin sayısı veya aynı anda gönderilebilecek bağımsız mesajların sayısı olduğu ortaya çıktı.
Tablo 4
(+1, 0, -1) kodlamaya geçerek , harflerin veya diğer sembollerin iletim hızının olduğu sonucu çıkar. %60 artırılabilir ve dört geçerli değer (+3, +1, -1 , -3 ) kullanırsanız , hız iki katına çıkarılabilir. Aynı anda bir yerine iki mesaj gönderdiği için, dörtlü telgraf sistemini yarattığında Edison'un yaptığı tam olarak buydu. Nyquist ayrıca sekiz geçerli değerin (0, 1, 2, 3, 4, 5, 6, 7 veya +7, +5, +3, +1, -1, -3, -5, -7) olduğunu gösterdi . ikiden dört kat daha hızlı mesaj gönderebilir. Bununla birlikte, devrelerdeki sinyal zayıflama derecesindeki değişiklikler nedeniyle, gürültü ve izin verilen maksimum gücü sınırlama nedeniyle çok sayıda akım değeri kullanıldığında ortaya çıkacak zorlukları açıkça anladı.
maksimum iletim hızını, 1 saniyede iletilebilen sinyal sayısının (noktalar, duraklamalar, akım değerleri) yarısı olarak tanımladı . Daha sonra bu tanımın, Nyquist'in ilk makalesinde hakkında hiçbir şey söylemediği bir dizi başka değerlendirme için oldukça uygun olduğunu göreceğiz.
Nyquist'in eserini yazdığı dönemde, hem telgraf hem de telefon mesajlarını aynı kablolar üzerinden iletmek oldukça yaygındı. Telefon, 150 2⅛'nin üzerindeki frekansları kullanır ve telgraf daha düşük frekanslarda gerçekleştirilebilir. Nyquist, telgraf sinyallerinin çok yüksek frekanslarda sinüzoidal bileşenlere sahip olmayacak ve aynı kablolar üzerinde yürütülen telefon görüşmelerini engellemeyecek şekilde nasıl şekillendirileceğini gösterdi. Hattaki sınırlayıcı hızın ve dolayısıyla iletim hızının, telgrafta kullanılan bant genişliği veya frekans bandı ile orantılı olduğuna dikkat çekti. Bu frekans aralığı, şimdi sinyalin veya devrenin bant genişliği olarak adlandırdığımız şeydir .
Makalesinin sonunda, önerilen telgraf sinyali türlerinden birini analiz eden Nyquist, bunun sabit genliğe sahip sinüzoidal bir bileşen içerdiğini gösterdi. Vericinin toplam gücünün bir kısmı bu bileşenin oluşturulması için harcansa da, alıcı için faydasızdır, çünkü bu bileşenin sürekli düzenli salınımlarını tahmin etmek ve bu salınımları baypas ederek alıcıya beslemek oldukça mümkündür. iletim hattı. Nyquist, kendisine göre değerli hiçbir şey taşımayan bu işe yaramaz bileşeni gereksiz olarak adlandırdı . G bu kelimeyi henüz karşılamadık.
Nyquist, telgrafın sorunlarını incelemeye devam etti ve 1928'de ikinci önemli makalesi olan "Telgraf Teorisinde Bazı Sorunlar" yayınladı. İçinde, bir dizi çok önemli hükmün ana hatlarını çizdi ve 2N gönderirsek bunu gösterdi. saniye başına farklı akım değerleri, o zaman N'nin üzerindeki frekanslara sahip sinyalin tüm sinüzoidal bileşenleri, bu bileşenlerin gönderilen sinyali geri yüklemek için gerekli olmadığı anlamında gereksiz olacaktır. Bu yüksek frekanslar tamamen ortadan kaldırılsa bile orijinal sinyalden iletilen akım değerlerinin belirlenmesi yine de mümkündür. Ayrıca, N Hz'nin üzerindeki frekansları içermeyen ve alıcı tarafta iletilen akım değerlerinin ne olduğunu yeniden yapılandırmanın kolay olacağı bir sinyalin nasıl üretileceğini gösterdi. İkinci makale daha nicel sonuçlar içeriyordu ve ilkinden daha doğruydu. Her ikisi de artık matematiksel iletişim teorisine dahil olan büyük ve önemli bir materyali kapsıyor.
Aynı sıralarda, kendi adını taşıyan jeneratörün mucidi Hartley, bilgi aktarımı üzerine teorik düşüncelerle uğraştı ve 1928'de “Bilgi Aktarımı” makalesinde düşüncelerinin sonucunu özetledi .
Hartley, bağlantı sorununu o tuhaf yollardan biriyle sundu, formülasyon o kadar basit ki, onu vermek için yıllarca kafa yormanız gerekiyor ve sonra her şey tamamen açık görünüyor. Bir mesajın göndericisini, zihinsel olarak karakter karakter seçerek bir karakter dizisi oluşturduğu bir dizi karakterin (örneğin alfabenin harfleri) sahibi olarak kabul etti. Hartley, bir bilardo topunun cebe çarpması gibi herhangi bir rastgele olayın olabileceğini kaydetti. ayrıca benzer bir dizi oluşturun. Daha sonra H mesaj bilgisini seçilebilecek olası karakter dizilerinin sayısının logaritması olarak tanımladı ve R == מ Iogs olduğunu gösterdi,
burada n , seçilen karakterlerin sayısı ve seçimin yapıldığı kümedeki farklı karakterlerin sayısıdır.
Bilgi teorisinin mevcut durumu ışığında, bu formülün ancak semboller birbirinden bağımsız olarak seçildiğinde ve s sembollerinden herhangi birinin seçilme olasılığı eşit olduğunda geçerli olduğu söylenebilir . Belki de, daha önce olduğu gibi, s sembol sayısının logaritmasının, aynı anda yapılabilecek 0-1 tipi bağımsız seçimlerin sayısı olduğu ve bilgi aktarım hızının eşit olması oldukça doğal olduğu da belirtilmelidir . n sembollerinin saniyesinde iletilen bilgi sayısı ile her sembolde bulunabilecek 0-1 bağımsız seçimlerin sayısı çarpılır.
Hartley daha sonra birincil sembolleri (örneğin alfabedeki harfleri) ikincil sembollerle (Mors alfabesindeki noktalar ve çizgiler) kodlama sorununa geçer. Bir mesajı maksimum hızda iletmeniz gerekiyorsa, ikincil karakterlerin uzunluğunun, birincil karakterlerin seçimine uygulanan kısıtlamalar dikkate alınarak seçilmesi gerektiğini belirtti (örneğin, E harfinin dikkate alınması gerektiği gerçeğini hesaba katmak gerekir). İngilizce'de Z harfinden çok daha yaygındır ). Gördüğümüz gibi, Morse'un kendisi bunu anladı, ancak Hartley'nin değeri, bu sorunu matematiksel olarak incelenebilecek şekilde formüle ederek daha fazla çalışmaya ivme kazandırması gerçeğinde yatıyor. Hartley ayrıca bu düşüncelerin konuşma veya görüntülerle iletilenler gibi sürekli sinyallerin incelenmesine nasıl uygulanacağına da dikkat çekti.
Son olarak, Nyquist ile tamamen aynı fikirde olan Hartley, iletilebilen bilgi miktarının, iletim süresi ile çarpılan bant genişliği ile orantılı olduğunu buldu. Ancak, iletim hızı için çok önemli olan soru, izin verilen maksimum akım değeri sayısı sorusu açık kaldı. Bunları nasıl tanımlarsınız?
Nyquist ve Hartley'in çalışmalarından sonra, iletişim teorisi uzun ve sakin bir tatil geçirmiş görünüyor. Araştırmacılar ve uygulayıcılar, bireysel iletişim sistemlerini yoğun bir şekilde inşa ettiler ve incelediler. İkinci Dünya Savaşı sırasında bu sanat çok karmaşık hale geldi. Bireysel yeni sistemlerin ve cihazların işleyişinin anlaşılmasında çok şey başarıldı, ancak genel prensipler ortaya konmadı.
Savaş sırasında uçakları düşürmek gerekiyordu ve bunun için radardan alınan çok yanlış ve "gürültülü" verilerden rotalarını tahmin edebilmek gerekiyordu. Dolayısıyla şu sorun ortaya çıktı: Belirli bir anda uçağın konumu hakkında bilgi içeren değişen bir elektrik akımı olsun ve üzerine anlamsız bir kaotik akım, yani gürültü bindirilsin. Sinyalin frekans spektrumunun gürültünün frekans spektrumundan farklı olması mümkündür. Durum buysa, üzerine gürültü bindirilmiş bir sinyalin, gürültüde en çok bulunan frekansları zayıflatan ve sinyalin baskın frekanslarını neredeyse hiç zayıflatmayan bir filtreden geçirilmesi arzu edilir. Ardından, orijinal sinyalin gürültüsüz olarak birkaç saniye içinde ne olacağını tahmin etmek için, filtreden sonraki elektrik akımı diğer devrelerden geçirilebilir. Ancak hangi elektrik devreleri kombinasyonu bu tahminleri yapmamızı en iyi sağlayacak?
olası sinyaller topluluğuyla (olası uçak rotaları) uğraşıyoruz , bu nedenle hangi sinyallerle uğraştığımızı önceden bilmek imkansızdır. Öngörülemeyen gürültü de karışır.
Bu sorun A. N. Kolmogorov tarafından ve bağımsız olarak Norbert Wiener tarafından çözüldü. Wiener bir matematikçidir, ancak eğitimi bu tür problemleri çözmek için idealdir. Savaş sırasında, zor bir sorunu çözdüğü (neden olduğu baş ağrıları için) sevgiyle Sarı Tehlike adını verdiği sarı ciltli bir eser yazdı.
Savaş sırasında başka bir matematikçi olan Claude Shannon, temel iletişim sorunuyla ilgilenmeye başladı. Savaştan sonra da yapmaya devam etti. Shannon işe çok sayıda yeni ve gerçek iletişim sisteminin göreli faydalarına bakarak ve bunların yararlarını karşılaştırmak için ortak bir yöntem arayarak başladı. Wiener's Cybernetics on Control and Communication'ın yayınlandığı yıl (1948) , Shannon modern iletişim teorisinin temeli sayılan iki bölümden oluşan bir makale yayınladı.
Hem Wiener hem de Shannon, tek bir sinyal problemini değil, bir gruptan veya başka bir deyişle olası sinyaller topluluğundan seçilen herhangi bir sinyali işleme problemini araştırdılar. Bu eserler neşredilmeden önce aralarında serbest bir fikir alışverişi gerçekleşmiş ve bunun sonucunda her iki eserde de benzer düşünce ve ifadeler ortaya çıkmıştır. Ancak Shannon'ın yorumunun benzersiz olduğu ortaya çıktı.
Wiener'in adı, esas olarak, belirli bir topluluğun sinyallerinin, özellikleri bilinen gürültüden çıkarıldığı bölge ile ilişkilidir. Böyle bir sorunun bir örneği yukarıda verilmiştir. Bu durumda, uçağın rotası düşman pilotu tarafından seçilir ve uçağın konumu hakkında bilgi içeren sinyal, alıcı yer belirleyicinin kendi gürültüsüne eklenir. Bu nedenle, bizim tarafımızdan seçilmeyen gürültü ile karıştırılmış, bizim tarafımızdan seçilmeyen bir dizi olası sinyal (uçak rotası) vardır. Ancak, sinyalin mevcut veya gelecekteki değerini (uçağın mevcut veya gelecekteki konumu) mümkün olduğunca doğru bir şekilde tahmin etmeye çalışıyoruz.
Shannon'ın adı, gürültü varlığında doğru ve hızlı mesaj iletimi sağlayacak, bilinen bir topluluktan seçilen böyle bir mesaj kodlama yöntemi arayışıyla ilişkilidir. Bir mesaj kaynağı olarak, örneğin, bizim tarafımızdan seçilmeyen bir metin alınabilir, ancak bir iletişim kanalı olarak - gürültülü bir telgraf kablosu (bizim tarafımızdan da seçilmemiştir). Shannon'a göre, ortaya konan problemde, mesajı kodlama yöntemini - örneğin mevcut değerlerin sayısı ve saniyedeki sayıları - seçmeye izin verilir. Bu durumda, sorun, sinyal gücünün en iyi tahminini elde etmek için sinyal ve gürültü karışımının nasıl ele alınacağı değil, belirli mesaj türlerinin belirli bir gürültülü üzerinden daha iyi iletilmesi için ne tür bir sinyalin gönderilmesi gerektiğidir. kanal.
Verimli kodlamayı seçme ve güvenilir sonuçlar elde etme konuları aslında bilgi teorisinin özüdür. Shannon'ın çalışmasında bir mesajlar bütününün ele alınması, Kolmogorov ve Wiener'in yanı sıra Morse ve Hartley'in çalışmalarından kaynaklanmaktadır.
Bu bölümde Shannon'ın çalışmasının içeriğini yeniden anlatmak anlamsız olacaktır, çünkü kitabın tamamı buna ayrılmıştır. Shannon'ın Nyquist ve Hartley tarafından ortaya konan birçok sorunu çözdüğünü ve onların çok ötesine geçtiğini göreceğiz.
Matematiksel iletişim kuramının ortaya çıkış sürecini göz önünde bulundurursak belki iki isimden daha söz etmek gerekir. 1946'da Denis Gabor, "İletişim Kuramı" başlıklı esprili bir makale yayınladı . Ancak pratikte modern iletişim teorisinin temel taşı olan gürültüyü dikkate almadı. 1949'da Taller, "Bilgi Aktarım Hızının Teorik Sınırları" adlı ilginç bir makale yayınladı . Kısmen, Shannon'ın çalışmalarıyla aynı zamana denk geldi.
Bu bölümün amacı, Shannon'ın kesin matematiksel iletişim kuramının telekomünikasyona ilişkin belirli problemlerin incelenmesinden doğduğunu göstermektir. Morse, alfabenin harflerini, telgrafta benimsenen noktalar, çizgiler ve duraklamalar gibi yokluk dönemleriyle ayrılmış kısa veya uzun akım darbeleriyle temsil etme sorunuyla karşı karşıya kaldı. Sıkça ortaya çıkan harfleri temsil etmek için kısa nokta ve çizgi kombinasyonlarını ve nadiren ortaya çıkan harfler için uzun kombinasyonları akıllıca seçti; matematiksel iletişim teorisinin hayati bir parçası olan verimli mesaj kodlama problemini çözen ilk etiketti.
Morse'un yaratıcı takipçileri, göndericiye hattı basitçe açıp kapatmaktan daha fazla sinyal seçeneği sunmak için değişen güç ve yönlerdeki akımları kullandılar. Bu, birim zaman başına daha fazla karakter göndermeyi mümkün kıldı. Ancak aynı zamanda, sinyalin şekli, istenmeyen elektriksel bozulmalardan (gürültü adı verilen) ve hızlı akım değişimlerinin doğru iletimini engelleyen iletişim kanallarının özelliklerinden daha fazla etkilenmeye, onu bozmaya başladı.
Çeşitli telgraf sinyallerinin karşılaştırmalı değerlerini değerlendirmek gerekli hale geldi. Bu, uygun matematiksel araştırma yöntemlerini gerektiriyordu. En önemli yöntemlerden biri, herhangi bir sinyali çeşitli frekanslardaki sinüzoidlerin toplamı olarak temsil etmenize izin veren Fourier analizi olduğu ortaya çıktı.
İletişimde kullanılan kanalların çoğu doğrusaldır. Bu, aynı anda böyle bir kanalda iletilen birkaç sinyalin etkileşime girmeyeceği ve birbirini atmayacağı anlamına gelir. Doğrusal kanalların çoğu sinyalin şeklini değiştirmesine rağmen, böyle bir kanalın sinüzoidal bir sinyal üzerindeki etkisinin yalnızca zayıflamasına ve zaman gecikmesine indirgendiği gösterilebilir. Bu nedenle, karmaşık bir sinyal, farklı frekanslardaki sinüzoidallerin toplamı olarak temsil edilirse, lineer kanalın her bir bileşeni ayrı ayrı nasıl etkilediğini hesaplamak kolaydır ve ardından bu zayıflatılmış bileşenleri ekleyerek, tam alınan sinyali elde ederiz.
Nyquist, saniyede bir kanaldan iletilebilen farklı akımların sayısının, kullanılan frekansların bant genişliğinin iki katına eşit olduğunu gösterdi. Bu nedenle, metin harflerinin iletilme hızı, bant genişliği ile orantılıdır. Ayrıca Nyquist ve Hartley, metin harflerinin iletim hızının, kullanılan mevcut değerlerin sayısının logaritması ile orantılı olduğunu gösterdi.
Tam bir iletişim teorisinin yaratılması, başka matematiksel yöntemler ve yeni fikirler gerektirdi. Belirli bir türdeki bilinmeyen bir sinyal problemini üzerine gürültü bindirilmiş olarak inceleyen Kolmogorov ve Wiener tarafından bağımsız olarak geliştirildiler. Parazite rağmen sinyalin doğasını belirlemenin en iyi yolu nedir? Kolmogorov ve Wiener bu sorunu çözdü.
Shannon biraz farklı bir sorunu çözmek için yola çıktı. . Metin gibi belirli bir türde mesajlar oluşturan bir kaynak olsun. Ve gürültülü bir iletişim kanalı olsun. Böyle bir kanal üzerinden mesajların mümkün olan en hızlı iletimini sağlamak için elektrik sinyallerini kullanarak kaynak mesajları nasıl temsil edilir veya kodlanır? Aslında, belirli bir türdeki bir mesaj, belirli bir kanal üzerinden hatasız olarak hangi hızda iletilebilir? Shannon'ın kendisine koyduğu ve çözdüğü görev yaklaşık olarak buydu.
Üçüncü bölüm
MATEMATİKSEL
MODEL
Yardımıyla çevremizdeki dünyadaki olayları açıklamaya ve tahmin etmeye çalıştığımız matematiksel teori, her zaman bu dünyanın basitleştirilmiş, matematiksel bir modeliyle ilgilenir ve bu model yalnızca incelenen mülkle bir şekilde bağlantılı olanı içerir.
Böylece gezegenler, farklı hallerde olabilen farklı maddelerden oluşur: katı, sıvı, gaz ve farklı basınç ve sıcaklıklarda. Bu aynı zamanda güneş ışığının yüzeylerinden yansımasının doğasını da belirler, bu nedenle bir gökbilimci gezegenleri bir teleskopla gözlemlerken üzerlerinde çeşitli renkli noktalar görür.
Ancak bir astronom-matematikçi, bir gezegenin Güneş etrafındaki yörüngesini hesaplarken bunu hesaba katmak zorunda değildir; sadece Güneş'in toplam kütlesini, gezegenin ondan uzaklığını ve aynı zamanda gezegenin zamanın ilk anındaki hareketinin hızını ve yönünü dikkate almalıdır. Daha doğru hesaplamalarla, gezegenin kendisinin toplam kütlesinin yanı sıra, çekim kuvvetleriyle üzerinde hareket eden diğer gezegenlerin hareketini ve kütlelerini de hesaba katmalıdır.
Bundan gökbilimcilerin gezegenlerin, yıldızların ve bulutsuların diğer özellikleriyle ilgilenmediği sonucu kesinlikle çıkmaz. Gezegen yörüngelerini hesaplarken bu özellikleri hesaba katmaya gerek yoktur. Bir matematiksel teorinin veya matematiksel modelin gücü ve özel çekiciliği, gereksiz özellikleri bir kenara atması ve yalnızca fenomeni anlamak için gerekli olanı seçmesinde yatmaktadır.
Farklı matematiksel modeller, farklı doğruluk derecelerine ve farklı uygulanabilirlik sınırlarına sahip olabilir. Örneğin, doğada kesinlikle katı bir cisim olmamasına rağmen, bir katı cisim olduğunu düşünürsek, bir gezegenin yörüngesini oldukça doğru bir şekilde tahmin etmek mümkündür. Öte yandan Ay'ımızın hareketi ancak suyun Dünya yüzeyindeki hareketi yani gelgitler dikkate alınarak açıklanabilir. Öyleyse, Ay'ın hareketinin çok doğru bir şekilde incelenmesiyle, Dünyamız artık katı bir cisim olarak kabul edilemez mi?
Benzer şekilde devre teorisinde ideal endüktansların, kapasitörlerin ve dirençlerin elektriksel özelliklerini incelediğimizde onlara bazı basit matematiksel özellikler atfederiz. Ancak modern televizyonların, radyoların ve telefonların yapıldığı parçalar, devre teorisindeki ideal endüktansların, dirençlerin ve kapasitansların yalnızca yaklaşık özelliklerine sahiptir. Bazen özelliklerin ideal olanlardan farkı küçüktür ve ihmal edilebilir. Ve bazen daha doğru hesaplamalarda dikkate alınması gerekir.
Elbette matematiksel bir model, gerçek dünyanın çok kaba ve hatta yanlış bir temsili olabilir.
deterministik sistemlere, yani davranışları genellikle tahmin ettiğimiz gibi oldukça tahmin edilebilir olan sistemlere örnektir.
makineler. Gökbilimciler gezegenlerin konumlarını binlerce yıl öncesinden hesaplayabilirler. Devre teorisinin yardımıyla , belirli bir elektrik sinyali uygulandığında bir elektrik devresinin nasıl davranacağını anlayabilirsiniz.
Bununla birlikte, tamamen rastgele olaylar için, örneğin aynı sayıda beyaz ve siyah top içeren bir kutudan herhangi üç top çekmek için bir matematiksel model oluşturmak mümkündür. Bu model üzerinde yapılan birçok denemeden sonra, ortalama olarak her sekiz denemede üç beyaz kabın yaklaşık bir kez, iki beyaz ve bir siyahın yaklaşık üç kez, bir beyaz ve iki siyahın üç kez ve üç siyahın söndürüleceğine ikna olduk. - bir kere. Aynı model üzerinde, belirli sayıda testten sonra bu oranlardan ne kadar sapma beklenmesi gerektiğini öğrenebilirsiniz.
Deneyimlerimiz, gerçek bir sistemin davranışının bir modelin davranışı kadar deterministik olmadığını ve zar atmak veya top çekmek kadar rastgele olmadığını gösteriyor. Bununla birlikte, deterministik bir modelin, örneğin bir kişinin diğer insanlarla iletişim kurarken davranışını açıklamak için hiç de uygun olmadığı ve rastgele bir olay modelinin veya istatistiksel bir modelin yine de uygun olabileceği oldukça açıktır.
Sigorta şirketlerinin kullandığı istatistiksel tabloların, belli bir yaştaki insanlar arasındaki ölüm yüzdesini tahmin etmede iyi olduğu, ancak şu veya bu kişinin ne zaman öleceğini tahmin edemediği iyi bilinmektedir. Bu nedenle, hem siyah hem de beyaz kapların bulunduğu bir kutudan ortalama olarak kaç kez üç siyah kabın çıkarılacağını tahmin eden aynı yöntemlerle, istatistiksel model insan davranışının bazı öğelerini anlamayı ve hatta bazen tahmin etmeyi mümkün kılar.
İstatistik tablolarının bir bireyin değil, bir grup insanın kaderini tahmin ettiğine itiraz edilebilir. Bununla birlikte, deneyim bize bazı durumlarda insan gruplarının yanı sıra bireylerin davranışlarını da tahmin etmenin mümkün olduğunu öğretir . Örneğin, E harfinin İngilizce nesirde kaç kez geçtiğini sayarsak, bunun metindeki toplam harf sayısının yaklaşık 0,13'ü olduğunu ve W harfinin bu sayının yalnızca 0,02'si olduğunu görürüz. Ve neredeyse aynı oranda EhWb harfleri bulacağız. herhangi bir İngiliz tarafından yazılmış nesir. Böylece, oldukça 62
Siz, ben veya bir başkası uzun bir mektup, makale veya kitap yazıyorsa, kullanılan tüm harflerin yaklaşık 0,13'ünün E harfi olacağını güvenle tahmin edin.
Davranışın bu öngörülebilirliği, özgürlüğümüzü diğer alışkanlıklardan daha fazla sınırlamaz. Herkesin yaptığı gibi E harfini veya başka bir harfi tam olarak bu oranda kullanmak zorunda değiliz . Gerçekten de, birkaç cesur insan olağan kalıptan ayrıldı. Ünlü kriptograf ve The Shakesperian Cipher Examined'in yazarı William Friedman bana aşağıdaki örnekleri verdi .
Alman şair Gottlob Burmann (1737-1805), 20.000 kelimelik 130 şiir yazdı ve R harfini bir kez bile kullanmadı . Üstelik Burmann, hayatının son on yedi yılında kullanmadı. konuşmasından bu 5 harfi çıkardı .
1641'de Lizbon'da yayınladığı beş öykünün her birinde sesli harfler yoktu. Diğer benzer örnekler Francisco Navarrete y Ribera (1659), Fernando Jacinto de Zurita y Garo (1654) ve Manuel Lorenzo de Lizarazu y Berbuisan'da (1654) bulunabilir .
romanı 1939'da yayımladı . Bu kitabın 267 sayfasında E harfi hiç kullanılmamıştır, oradan bir paragrafı aşağıya alıntılıyorum:
Bu temelde, size bir grup parlak genç insanın nasıl bir Şampiyon bulduğunu göstereceğim ; а тап kendi erkek ve kızlarıyla; O kadar baskın ve mutlu bir kişiliğe sahip bir adam ki, Gençlik ona bir sineği şekerlik gibi çekiyor. Küçük bir kasaba hakkında bir hikaye . Dedikodu ipliği değil ; ne de "uzun, dolambaçlı bir köy yolunda karanlık gölgeler düşüren romantik ay ışığı" gibi Alışılmış "doldurmalarla" dolu kuru, monoton bir anlatım değil . Uzak kıvrımları uğuldayan çıngıraklar hakkında da bir şey söylemeyecek ; alacakaranlıkta şarkı söyleyen ardıç kuşları, ne de kabin penceresinden gelen sıcak lamba ışığı. Hayır. Bu, devam eden bir faaliyetin anlatımıdır; Gençliğin bugün olduğu gibi canlı bir tasviri ; ve bir çocuğun hiçbir şey bilmediğine dair unutulmuş fikrin pratik olarak bir kenara bırakılması .
Özgürlüğün bu tür tezahürleri, alışkanlık zResimlerini kırma olasılığını kanıtlayacak olsa da, yine de çoğu zaman bizim için daha uygun bir şekilde yazarız. Aksini yapabileceğimizi göstermeye çalışmazsak, o zaman alışkanlıktan, neredeyse makinenin sabitliği veya matematik kuralının değişmezliği nedeniyle, E harfini tam olarak gerektiği kadar yazacağız .
Bu, aynı alışkanlıklara sahip bir makinenin İngilizce bir metin yazabileceği şeklindeki ters iddiayı kesinlikle ima etmez. Ancak Shannon, bir makinenin yapabileceği bir matematik hilesi kullanarak İngilizce kelimelere ve İngilizce metne nasıl yaklaşılabileceğini gösterdi.
Örneğin, bir dizi harf ve aralarındaki boşluklar oluşturulsun; Herhangi bir harfin veya boşluğun ortaya çıkmasının eşit derecede olası olduğunu varsayalım. Bunu şu şekilde yapabilirsiniz: Harfli ve üzerlerinde boşluk yazılı kartları bir şapkaya koyun, karıştırın, bir kart çekin, içindekini yazın, kartı geri koyun, tekrar karıştırın, başka bir kart çekin vb. Bunu yaparken, Shannon'ın İngilizce metne sıfır dereceli bir yaklaşım dediği şeyi elde ederiz. İşte bu yöntemle elde edilen bir "metin" örneği.
Sıfır sıralı yaklaşım (işaretler bağımsızdır ve oluşmaları eşit derecede olasıdır)
Xfoml Rxkhrjffjuj Zlpwcfwkcyj Ffjeyvkcqsghyd Qpaamkbzaacibzlhjqd.
ZhWh harfi var , E ve boşluklar açıkça yeterli değil . İngilizce metne en iyi yaklaşım, harflerin birbirinden bağımsız seçilmesiyle elde edilebilir, ancak E harfinin W veya Z harflerinden çok daha sık seçilmesiyle elde edilebilir. şapka ve WhZ harfli birkaç kart . Çekilen harfin E olma olasılığı 0,13 olması gerektiğine göre , şapkaya konulan her yüz karttan on üçünde E olması gerekir. Çekilen harfin W olma olasılığı 0,02 olmalıdır , yani her yüz kart için şapkaya koyun, iki tanesi W harfine sahip olmalı vb.
Shannon'ın İngilizce metne birinci dereceden bir yaklaşım dediği şeyi veren, açıklanan prosedür kullanılarak elde edilen sonuç:
Birinci dereceden yaklaşım (işaretler bağımsızdır, ancak İngilizce metindekiyle aynı sıklıkta tekrarlanır)
OCRO HLI RGWR NMIELWIS EU LL NBNESEBYA TH EEI Alhenhttpa oobttva nah brl
kombinasyonu dışında , Q ile başlayan tek bir harf çifti yoktur . QX veya QZ ile karşılaşma olasılığı sıfırdır. QU oluşma olasılığı sıfır olmasa da o kadar küçük ki kullandığım tablolarda görünmüyor. Öte yandan, TH kombinasyonunun oluşma olasılığı 0,037 , OR'nin olma olasılığı 0,010 ve WE'nin olma olasılığı 0,006'dır . Bu olasılıklar şu anlama gelir. Metnin 10.001 harf içermesine izin verin. Sonra birinci ve ikinci harfler, ikinci ve üçüncü vb. 10.000 ardışık harf çifti verecektir. Belirli sayıda TH kombinasyonu olacaktır. 370 kez gerçekleştiğini varsayalım . Bu sayıyı, varsayıma göre 10.000'e eşit olan toplam çift sayısına bölersek, o zaman TH kombinasyonunun metinde rastgele bir seçimde görünme olasılığını elde ederiz , yani bu olasılık 370/10.000'e eşittir veya 0,037.
Çalışkan kriptograflar, digram denilen iki harfli grupların İngilizce bir metinde görünmesi için olasılık tabloları derlediler . İngilizce metinde olduğu gibi aynı digram oluşum olasılıklarını kullanarak bir harf dizisinin nasıl oluşturulabileceğini gösterelim. Bunu yapmak için 27 şapka alıyoruz : bunlardan 26'sı alfabenin her harfiyle başlayan digramlar için ve biri boşlukla başlayan digramlar için. Daha sonra, gerçekleşme olasılıklarına göre üzerlerinde digramların yazılı olduğu şapka kartlarını koyarız, yani her 1000 kart 37 TH digramı , 6 WE diyagramı vb. içermelidir.
Digramlarla dolu şapkaların anlamını anlamak için bir an duralım ve oluşma sıklığının ilk değerleri aracılığıyla, digramların ortaya çıkma olasılıklarını hesaplamaya geçelim.
T'leri bulmak istiyoruz ve bunu yapmak için onu harf harf inceliyoruz. Kartlara yazacağız ve T harfiyle başlayan tüm digramları tek bir şapkaya koyacağız. Bu durumda, metinde T harfleri olduğu kadar tam olarak bu tür digramların olduğu ortaya çıkacaktır . Ve bu digramların toplam digram sayısına oranı, T harfinin metinde geçme olasılığı yani 0.10'dur. Bu olasılığı göster p (T); o zaman yazabilirsin
p (T) = 0.10.
65
J. Pierce
T harfiyle başlayan digramların oranı değil , aynı zamanda T harfiyle biten farklı şapkalara dağıtılan digramların oranı olduğuna dikkat edin.
Ayrıca, metindeki toplam harf sayısı 1001 ise ve sonuç olarak ardışık digramların sayısı 1000 ise, o zaman TH digramı 37 kez oluşacaktır ve bu nedenle oluşma olasılığını p (T, H) olarak göstereceğiz. ve eşittir
p(T, H) = 0.037.
100 digramın veya toplam sayısının 0.10'unun T harfi ile başlayacağı ve bu nedenle T hat içine düşeceği ve bunların 37'sinin TH digram olacağı artık açıktır . Böylece TH digramlarının T harfi ile başlayan toplam digram sayısına oranı 37/100 veya 0,37 olacaktır . Buna göre, T harfi ile başlayan digramın TH , yani.
p t (H) = 0.37;
rt (H), H harfinin T harfinden sonra gelmesinin koşullu olasılığıdır .
harflerin hem de digramların İngilizce ile aynı sıklıkta göründüğü bir metin oluşturmak için kullanılabilir . Bunu yapmak için herhangi bir şapkadan rastgele bir kart çekeceğiz ve ona yapıştırılan harfleri yazacağız. Daha sonra birinci digramın ikinci harfi ile ikinci kartı çıkarmamız gereken şapkayı belirleyip ikinci digramın ikinci harfini yazıyoruz. Sonra, ikinci digramın ikinci harfine göre, üçüncüsünün çıkarılacağı şapkayı belirleriz ve böyle devam eder, bir boşluktan sonra belirli bir harfin ("sözcüğün" başlangıcı) olacağı belirli bir olasılık.
Benzer bir yöntemle Shannon, İngiliz diline ikinci dereceden bir yaklaşım dediği şeyi inşa etti.
İkinci dereceden yaklaşım* (digram yapısı İngilizce ile aynıdır)
0N 1E Antsoutinys are t t t t deamy AGHiN D Teasonare fuso TIZIN ANDY TOBE SACE CTISBE'de Ilonasive tugoowe
Kriptograflar, trigram denilen üç harfli grupların ortaya çıkması için olasılık tabloları derlediler . Bu olasılıklar kullanılarak , Shannon'ın İngiliz diline üçüncü dereceden bir yaklaşım dediği şey elde edilebilir. İşte çalışmasından bir örnek:
Üçüncü mertebenin yaklaşımı (trigramların yapısı İngilizce ile aynıdır)
IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID Demonstures Pondenome of Demonstures of tne reptagin is Regoactiona of cre
Shannon tarafından verilen bu dört örnek incelenirse, İngilizce metne artan bir benzerlik görülür. Örnek 1, sıfır mertebesi yaklaşımı, kelime benzeri kombinasyonlar içermez. Harflerin tekrarlanma sıklığını hesaba katan 2. örnekte , OCRO ve NAH kombinasyonları belli belirsiz İngilizce kelimeleri anımsatmaktadır. Digramların görülme sıklığının dikkate alındığı Örnek 3'te, tüm “kelimeler” telaffuz edilebilir ve ON, ARE, BE, AT, ANDY İngilizce kelimelerdir. Trigramların görülme sıklığını hesaba katan 4. örnekte , zaten sekiz İngilizce kelime ve kulağa İngilizceye çok benzeyen birçok kelime görüyoruz, örneğin GROCID, Pondenome, Demonstlres.
Aynı deney, Latince istatistikleri kullanılarak G. Guilbaud tarafından gerçekleştirildi ve Latince'yi anımsatan üçüncü dereceden bir yaklaşım (yani, trigramların oluşum sıklığını dikkate alarak) elde edildi. Aşağıda bu yaklaşımın bir parçasını veriyorum.
IBUS GENT IPITIA VETIS IPSE CUM VIVIVS SE ASETITI dedentur
Latince kelimelerin altı çizilidir.
1, 2, 3 veya n harflik bir grubun ortaya çıkma olasılığını verirsek ve eğer biz anneye bir kap çıkarma, madeni para atma veya rastgele bir sayı seçme simülasyonu fırsatı verin, herhangi bir dilde yazılmış bir metne oldukça iyi bir yaklaşım elde etmek için yapılabilir. Makineye ne kadar eksiksiz bilgi girilirse, ürünleri de o kadar yakın olacaktır.
hem istatistiksel yapı hem de görünüm olarak bazı metinlere benzer.
Makinenin olma olasılıklarına göre üç harfli grupları seçmesine izin verilirse, oluşturduğu üç harfli herhangi bir kombinasyon İngilizce bir kelime veya İngilizce bir kelimenin parçası olmalıdır ve iki harfli herhangi bir "kelime" olması zorunludur. İngilizce bir kelime. Ancak bir makine, genellikle yalnızca gerçek bir sözcük olan harf dizilerini yazan bir insandan daha az tutucudur. Kendini beğenmiş PONDENOME'u, şüpheli 1LONASIVE'ı, biraz kaba GROCID'i, bilgin DEMONSTURES'ı ve tuhaf ama çekici DEAMY'yi özlemek kaçınılmazdır . Tabii ki prensipte böyle bir şey yazabilirdi , ama genellikle yazmaz.
En uzun İngilizce sözcük kadar uzun olan harf gruplarını seçmesi sağlanarak makinenin İngilizce olmayan sözcükler oluşturma yeteneğinden kurtarılabilir. Ancak makineye harflerdense tüm sözcükleri bir kerede girmek ve bu sözcükleri olma olasılıklarına göre çıktısına bırakmak çok daha kolay olurdu.
Shannon, kelimelerin birbirinden bağımsız olarak seçildiği, ancak İngilizce metinde bulunma olasılıklarıyla aynı olduğu bir örnek verdi. Onun örneğinde , ve, tapi vb. Bu, örneğin şu şekilde yapılabilir: bazı metinleri ayrı sözcüklere ayırın, bunları bir şapkaya koyun ve ardından teker teker çıkarın. Shannon buna birinci dereceden kelime düzeyinde bir yaklaşım diyor.
Kelime düzeyinde birinci dereceden yaklaşım. Burada kelimeler birbirinden bağımsız olarak, ancak kendi sıklıklarıyla seçilir.
Temsil etmek ve hızlı bir şekilde iyi bir apt veya GOME GAN FARKLI DOĞAL BURADA HE THE A OYUN İÇİ THE TO OF TO OF UZMAN GRAY GOME TO'ya satır mesajını verir bunlar olsaydı
Çeşitli kelime çiftlerinin oluşma olasılıklarının toplanacağı böyle tablolar yoktur. Ancak Shannon, kelime çiftlerinin ortaya çıkma olasılıklarının şu anki ile aynı olduğu rastgele bir metin pasajı oluşturmayı başardı .
metin. Karşısına çıkan ilk romanda ilk kelime çiftini rastgele seçmişti. Daha sonra tüm romanı baştan aşağı tarayarak birinci çiftten ikinci kelimenin geçtiği bir yeri bulmuş, ondan sonra gelen kelimeyi eklemiş vs.Böylece aşağıda verilen ikinci dereceden yaklaşıklığı kelimeler düzeyinde elde etmiştir. .
İkinci mertebenin kelime düzeyinde yaklaştırılması. (Bir kelimeden diğerine geçiş olasılıkları doğrudur, ancak daha derin kalıplar dikkate alınmaz.)
İNGİLİZ BİR YAZARIN BAŞINA VE ÖNÜNDEN SALDIRISI BU NOKTANIN KARAKTERİNİN OLDUĞU NEDENİYLE HİÇ KİMİN SORUNU BEKLENMEYEN BİR ŞEKİLDE ANLATTIĞI Harfler için başka bir yöntem
Ortaya çıkan pasajda, gerçek bir İngilizce metne dönüşebilecek ifadelere benzeyen yerler olduğunu görüyoruz.
Bakalım elimizde ne var. Tele daktilo ile gönderilenler gibi normal İngilizce metinlerde, tek tek harfler neredeyse sabit bir sıklıkta geçer. Yeterince uzun bir metinde, harf çiftleri, üç ve dört harften oluşan kombinasyonlar neredeyse sabit bir sıklıkta ortaya çıkar. Sözcükler ve sözcük çiftleri de neredeyse sabit sıklıkta ortaya çıkar. Ayrıca, isteğe bağlı olarak bir makinenin gerçekleştirebileceği rastgele bir matematiksel işlemin yardımıyla, İngilizce diline özgü istatistiksel kalıplara sahip bir dizi İngilizce kelime veya harf elde edeceğiz.
Ancak gelişmiş bir makine bile, bir kişinin düşünebileceği tüm sözcük dizilerini yaratamaz, çünkü onun arzı her zaman zaten karşılaşılan sözcük kombinasyonlarıyla sınırlı olacaktır ; diğer kombinasyonlar hakkında, istatistiksel verilere sahip olmayacaktı. Ne de olsa, pekala şunu söyleyebilirim: "Eflatun bir tayfun geçti ve piskoposun yüzünü temiz bir şekilde lekeledi" ve eminim bunu benden önce kimse söylememiştir.
İngiliz dili yalnızca istatistiksel kurallara değil, aynı zamanda gramer kurallarına da uyar. Bir dilden diğerine çeviri yapan makinelerde çalışan dilbilimciler ve mühendisler, makinelerinin kelimeleri birleştirebilmesi ve tam olarak aynı kombinasyonla henüz karşılaşılmadığında bile (ancak çevrilmekte olan metni anlamlandırmak için) dilbilgisi açısından doğru ifadeler üretebilmesi için bu kuralları bulmalıdır. anlaşılabilir). Bu zor bir problem. Ancak rastgele sınırlı sayıda dilbilgisi açısından doğru ifade üreten bir "makineyi" tanımlamak zor değildir.
Resimde. 3.1, böyle bir "makinenin" bir diyagramını gösterir. Numaralandırılmış her kutu bir makine durumunu temsil eder . Dikdörtgenlerin veya durumların sayısı sonludur, bu nedenle buna sonlu sayıda durum içeren bir makine denir .
Her dikdörtgenden diğer dikdörtgenlere birkaç ok gider. Bu makinede, her dikdörtgenden diğer iki dikdörtgene sadece iki ok gider. Burada, her okun yanında 1 / 2 sayısı yer alır ; bu , bir arabanın 2. durumdan 3. duruma gitme olasılığının 1/2 olduğu ve bir arabanın 2. durumdan 4. duruma gitme olasılığının da 1/2 olduğu anlamına gelir .
Makineyi başlatmak için bir dizi rasgele seçim gereklidir. Bu sıra bir yazı tura atılarak elde edilebilir. Tura gelirse üst oku , yazı gelirse alttaki oku takip edeceğiz , böylece yeni bir duruma nasıl geçeceğimize karar vereceğiz. Geçiş yapıldığında, bu yeni duruma karşılık gelen kelimeyi, kelime kombinasyonunu veya sembolü dikdörtgenin içine yazdırıyoruz, ardından yazı tura atıyoruz ve bir sonraki durumu alıyoruz.
Yazı kaybını O harfiyle ve yazı kaybını P harfiyle gösterelim. Örneğin, durum 7'den başlarsak ve yazı tura atarak şu sırayı alırdık: RROORRRRROOO, o zaman. "makine" yazdırırdı
Federal Soruşturma Bürosu hiçbir kongreyi soruşturmadı . hiçbir federal Soruşturma Bürosu KONGREYİ TEMİZLEMEDİ VE federal Soruşturma Bürosunu YOK ETTİ ve KONGRE DELİLİNİ BULMADI
Bu süreç süresiz olarak devam ettirilebilir, asla bir öncekini tamamen tekrarlamaz ve sınırsız uzunlukta "cümleler" oluşturur.
Şekil 3.1.
Dolayısıyla, belirli bir olasılık tablosuna göre 1 rasgele bir karakter dizisi (harfler ve boşluklar) veya bir sözcük dizisi 1 seçerseniz , 1 İngilizceye benzeyen bir metin elde edebilirsiniz. BEN
geçişlerden birinin rasgele seçimi verildiğinde , aynısı sonlu sayıda durumla makine 1'den elde edilebilir. Böyle bir sürece 1 stokastik veya olasılıksal denir , çünkü içinde bir rastgelelik unsuru vardır . 1
İngilizce metnin bazı özelliklerini inceledik. Biz | E harfinin ortalama sıklığının 1 değil, metnin bir kişi tarafından mı yoksa birçok kişi tarafından mı yazıldığına bağlı olduğunu bulmuştur. Başka, daha karmaşık düzenlilikler de vardır, örneğin, digramların (TH, WE , vb.) Oluşma sıklığının sabitliği . Ayrıca, İngilizce'ye benzer bir metnin bir dizi rastgele seçimle elde edilebileceğini de gösterdik, örneğin şapkadan kart çekmek veya yazı tura atmak, tabii ki dilin doğasında var olan yasalara uyulması koşuluyla. Böyle bir metni elde etmenin bir yolu, Şekil 1'de gösterilen gibi bir sonlu durum makinesi kullanmaktır. 3.1.
İngilizce metnin kaynağının matematiksel bir modelini arıyorduk. Böyle bir model, gerçek metne çok benzer bir metin üretebilmelidir, o kadar benzer ki, onu kodlama ve iletme sorunu, gerçek metni kodlama ve iletme sorununa eşdeğerdir. Modelin matematiksel özellikleri, oluşturduğu metnin kodlanması ve iletilmesi ile ilgili yararlı teoremlerin ispatlanabilmesi ve bu teoremlerin gerçek metin kodlanırken yüksek doğrulukla uygulanabilmesi için matematiksel olarak tanımlanmalıdır. Bununla birlikte, modelin çıktısının tamamen doğal dil pratiğine uygun olmasını şart koşmak pek de gerekli değildir.
bir metin (veya diğer mesaj türleri) oluşturan bir kaynağın matematiksel modeli olarak ergodik bir kaynak seçti . Ne olduğunu anlamak için önce durağan kaynağın ne olduğunu anlamalısınız . Burası başlayacağımız yer.
Sabit bir kaynağın genel fikri, ismine zaten yansıtılmıştır. Çalıştırıldıktan sonra yaratmaya başlayan hayali bir makine düşünelim.
bu türden sonsuz bir dizi: AEAAAAAAAEit. D.
Böyle bir kaynağa en uygun ismin “sabit” olduğu açıktır . çünkü hep aynı şeyi yaratır. Şimdi bu kaynağı çalıştırdıktan sonra formun bir dizisini oluşturan kaynakla karşılaştıralım.
AAAAAAAAAEEEE it. D.
Burada, yalnızca bir harf, A veya E içeren boşluklar uzar ve uzar ve böyle bir kaynak elbette durağan olarak adlandırılamaz.
2 ) bir harf dizisidir . Örnek 3 ve 4'teki digram ve trigram kaynakları da durağandır.Sabit bir kaynağın temel fikri oldukça basittir. Karşılık gelen matematiksel tanımı vermek biraz daha zordur.
Kaynağın durağan olduğu varsayımı, özelliklerinin zaman içinde değişmediğini ima eder. Bununla birlikte, ikinci harfin oluşma olasılığının bir öncekinin ne olduğuna bağlı olduğu bir digram kaynağı düşünelim. Böyle bir kaynağa A harfiyle başlarsanız, ardından birkaç farklı harf gelebilir ve Q harfiyle başlarsanız , ikinci harf mutlaka U harfi olacaktır. başlatma yöntemi, oluşturulan harf dizilerinin istatistiksel düzenliliklerini etkileyecektir.
Bu zorluğun üstesinden gelmek için matematikçiler, kaynağın tek bir dizi değil, bir çokluk oluşturduğunu düşünmeyi önerdiler. Sonuçta bu kaynak hayali bir makinedir ve sonsuz sayıda çalışıp sonsuz sayıda harf dizisi oluşturduğu düşünülebilir. Böyle sonsuz bir dizi dizisine dizi topluluğu denir.
Bu diziler çok özel bir şekilde başlatılabilir. Örneğin, kaynak digramlar oluşturuyorsa, tüm dizilerin 0,13'ü E harfiyle başlayabilir (0,13, E harfinin İngilizce metinde görünme olasılığıdır), tüm dizilerin 0,02'si W harfiyle başlayabilir vb. e. Bunu yaparsak, diziler topluluğunun tüm ilk harflerinin ortalaması alınan E oranının, tüm ikinci harflerin, tüm üçüncü harflerin vb. üzerindeki ortalaması ile aynı olacağını buluruz. Hangi harften başlarsa başlasın, E harfinin mi yoksa başka bir harfin mi oranının tüm dizilerde aynı olacağını seçmek. TH veya WE digramının ortaya çıkma olasılığı, bu kombinasyonların topluluk dizilerindeki birinci, ikinci veya üçüncü çiftin ne olduğuna da bağlı olmayacaktır .
Durağanlıktan kastedilen budur. Kaynak bir harf dizileri topluluğu oluşturduğunda ortaya çıkan çeşitli olası başlangıç koşulları altında olasılıkları belirlemenin bir yolunu bulmak mümkün ise ve bu olasılıklar, topluluk üzerinden ortalama alınarak elde edilen herhangi bir istatistiksel düzenliliğin ne kadar uzak olduğuna bağlı olmayacağı şekildedir. ortalama alma baştan yapılır, ardından kaynak durağandır. Bu tanım okuyucuya zor ve anlaşılmaz görünebilir, ancak herhangi bir fikri kullanışlı ve kesin bir matematiksel forma sokacaksak zorluklardan kaçınılamaz. Aksi takdirde, fikir matematiksel olarak işe yaramaz.
birinci harfler veya tüm ikinci harfler veya tüm üçüncü harfler (veya çiftler veya üçlü harfler) üzerinden gerçekleştirildiği varsayılmıştır. . Bu ortalamaya toplu ortalama denir . Bu, bölümün başında tartıştığımız ortalama alma yönteminden farklıdır. Daha sonra tüm harfler gelişigüzel bir şekilde tek bir dizide toplandı ve ardından ortalama bulundu. Bu ortalamaya zaman ortalamasi denir .
Zaman ortalaması ve topluluk ortalaması farklılık gösterebilir. Örnek olarak, üçte bir oranında A harfi ile başlayan ve A ve B harflerini oluşturan, üçte bir oranında B harfi ile başlayan ve B harflerini oluşturan bir kaynak düşünün.
Tablo 6
ve A ve zamanın üçte biri E harfi ile başlar ve bir E harfi dizisi oluşturur:
ABAVAB vb.
WAWAWAWAit. D.
EEEEEEEEE. D.
Kaynak durağan olmasına rağmen, farklı ortalama alma yöntemleriyle elde edilen olasılıkların farklı olduğunu görmek kolaydır (Tablo 5).
Kaynak durağansa ve topluluk üzerindeki herhangi bir olası ortalama (ortalama harf, digram, trigram vb.) zaman içindeki karşılık gelen ortalamaya eşitse, kaynağın ergodik olduğu söylenir. Aşağıdaki bölümlerde ele alınan bilgi teorisi teoremleri yalnızca ergodik kaynaklar için geçerlidir ve bunların ispatı, mesaj kaynağının ergodik* olduğu varsayımına dayanmaktadır.
ayrık kaynakları ele aldık , ancak bilgi teorisi aynı zamanda sürekli kaynaklarla da ilgilenir; örneğin, ses titreşimleri veya telefondaki karşılık gelen elektrik akımı salınımları gibi yumuşak bir şekilde değişen sinyaller oluşturan kaynaklar. Bu tür sinyallerin kaynaklarının da ergodik olduğu varsayılmaktadır.
O halde hangi nedenlerle ergodik kaynak en uygun ve karlı matematiksel model oldu?
♦ Sabit olmayan kaynaklardan gelen mesajların kodlanması ile ilgili çok sayıda çalışma vardır ve bu hususlar bu kitapta ele alınmamıştır.
İlk olarak, bir ergodik kaynağın tanımından, örneğin bir harfin (E diyelim) veya bir digramın (TH diyelim) olasılığı gibi bir mesajın istatistiksel modellerinin mesajın uzunluğu boyunca değişmediği sonucu çıkar . Mesajın giderek daha uzun bir bölümünü inceleyerek, çeşitli harflerin ve bunların kombinasyonlarının ortaya çıkma olasılıkları hakkında her zamankinden daha doğru bir tahmin elde ediyoruz. Başka bir deyişle, mesajın giderek daha uzun bir bölümünü inceleyerek, kaynağın daha doğru bir matematiksel tanımını elde edebilirsiniz.
, yalnızca bu mesaj için değil, belirli bir kaynak tarafından oluşturulan tüm mesajlar için geçerli olmaktadır . Ergodik bir kaynak için bu, zaman ortalamasının ve topluluk ortalamasının eşit olması gerekliliği ile garanti edilir.
Bu nedenle, ergodik bir kaynak, son derece basit bir olasılıksal veya stokastik mesaj kaynağıdır ve basit süreçlerle başa çıkmak, karmaşık olanlardan daha kolaydır. Ancak sadelik tek başına yeterli değildir. Ergodik kaynak, yalnızca basit değil, aynı zamanda gerçeğe de yakın olsaydı, matematiksel iletişim kuramıyla hiç ilgilenmezdi.
Matematiksel iletişim teorisinin iki yönü vardır. Matematiksel olarak titiz olan biri, sonsuz sembol dizilerinden oluşan sonsuz bir topluluk yaratabilen varsayımsal, tamamen ergodik bir kaynakla ilgilenir. Matematiksel olarak , neyin araştırılacağı önemli değildir - kaynağın kendisi veya oluşturabileceği mesajlar.
Ancak öte yandan, gerçek bir İngilizce metnin iletilmesi problemlerini geliştirirken matematiksel iletişim teorisinin teoremlerini kullanırız . İnsan bir hipotez veya bir makine değildir. Sonsuz bir diziler topluluğu şöyle dursun, sonsuz bir harf dizisini bile yaratmaya muktedir değildir.
Yine de insanoğlu pek çok uzun harf dizisi yaratır ve İngilizce yazan herkes, ortak çabalarıyla bu türden pek çok uzun harf dizisi yaratır. Bu çok sayıda dizinin bir kısmı aslında teleyazı ile gönderilir.
Bu nedenle, İngilizce telgraf gönderen tüm Amerikalıları en azından yaklaşık olarak ergodik bir telgraf mesajı kaynağı olarak ve telefonda konuşan tüm Amerikalıları en azından yaklaşık olarak ergodik bir telefon sinyali kaynağı olarak ele alacağız. Ancak, Fransızca yazan herkesin artı İngilizce yazan herkesin ergodik bir kaynak oluşturamayacağı oldukça açıktır. Her birinin yazdığı metinde, tek tek harflerin, digramların, trigramların, sözcüklerin vs. ortaya çıkma olasılıklarının iyi tanımlanmış, zaman ortalamalı olasılıkları olacaktır. ancak her dildeki olasılıklar farklı olacaktır ve topluluk ortalaması ortaya çıkan metinlerin hiçbirine benzemeyecektir.
İngilizce yazan herkesin (ve İngilizce konuşan herkesin) tam anlamıyla ergodik bir mesaj kaynağı olduğunu iddia etmeyeceğiz. İngiliz dilinin istatistiksel düzenlilikleri, tartışılan konuya ve hedeflere bağlı olarak biraz farklılık gösterir ve farklı insanlar biraz farklı yazar. Aynı şekilde telefonda kimisi alçak sesle konuşur, kimisi bağırır, eh. Bazı insanlar sadece sinirlendiklerinde bağırırlar. Yalnızca , İngilizce metnin farklı örneklerinde E harfinin görünme olasılığının değişmezliği gibi, birçok mesajın istatistiksel kalıplarında şaşırtıcı bir tekdüzelik olduğunu belirtiyoruz . Ergodik kaynaklar olarak konuşma ve yazı gerçeği tam olarak yansıtmıyorsa, yine de yararlı olacak kadar doğrudurlar.
Mesajların gerçek, yaklaşık olarak ergodik kaynağının, matematiksel iletişim teorisinde tanıtılan katı biçimde ergodik mesaj kaynağından farklı olduğu her zaman hatırlanmalıdır. Gerçek sorunları çözmek için matematiksel iletişim teorisinin sonuçlarını uygularken makul özen gösterilmelidir. Diğer alanlarda buna alışkınız. Örneğin matematikten, bir dairenin üç noktasının koordinatları yeterli doğrulukla biliniyorsa çapının hesaplanabileceği bilinmektedir. Yine de, aklı başında hiç kimse, bir kağıt parçasına çizilen gerçek, genellikle biraz düz olmayan bir dairenin çapını, çevresi üzerindeki üç noktanın konumunu bir santimetrenin en yakın binde biri ile ölçerek belirleyemez. Büyük olasılıkla, merkezden geçen düz bir çizgi çizecek ve çapı basitçe daire üzerindeki zıt noktalar arasındaki mesafe olarak ölçecektir. Kesin matematiksel teoriyi pratikte uygularken bu türden muhakeme ve ihtiyat gözetilmelidir.
Hangi önlemi alırsak alalım, stokastik sürecin bir kişinin mesaj kaynağı rolünde bir modeli olarak kullanılması felsefi soruları gündeme getiriyor. Bu, insan eylemlerinin rastgele olduğunu düşündüğümüz anlamına mı geliyor? Hiçbir şey böyle değil. Bir insan hakkında, çevresi hakkında, biyografisi hakkında yeterince bilgi sahibi olursak, hayatın farklı durumlarında hangi kelimeyi söyleyeceğini veya yazacağını tahmin etmemiz oldukça olasıdır.
Bununla birlikte, matematiksel iletişim teorisinde, kaynak hakkındaki bilgimizin ya onun yarattığı mesajları incelemenin bir sonucu olarak ya da kişinin kendisinin tam olmaktan çok uzak bir incelemesinin bir sonucu olarak elde edildiği varsayılır. Bu şekilde elde edilen bilgilerden, daha önce gördüğümüz gibi, mesajdaki bir sonraki harf veya kelimenin bu özel harf veya kelime olma olasılığının daha doğru bir şekilde belirlenmesine yardımcı olan bazı istatistiksel veriler çıkarılabilir. Ancak bir belirsizlik unsuru varlığını sürdürüyor. Tam bir bilgi olmadığı için bize öyle geliyor ki mesajların kaynağı 6ιj∂mo gibi davranıyor. içinde rastgele bir seçim yapılıyor ve bu seçimin ne olacağını tahmin etmek imkansız. Seçim önceden tahmin edilebilseydi, o zaman bunu yapmamıza izin veren ek bilgileri kaynağımızın istatistiksel düzenliliklerine dahil etmemiz gerekirdi. Ancak bu bilgiden daha fazlasına sahip olsaydık, rastgele olmadıklarını bile bile tahmin edemediğimiz seçim vakaları bulabilirdik. Henüz sahip olmadığımız bilgilere dayanarak oldukça tahmin edilebilirler.
3.1) yeteneklerinin tarafımızdan tam olarak açıklanmadığını görmek kolaydır . Sonlu sayıda duruma sahip makinelerin girdileri ve çıktıları olabilir. Bir durumdan diğerine geçişin rastgele seçilmesi gerekmez; böyle bir geçiş, makineye çeşitli veriler girilerek etkilenebilir. Böylece, sonlu sayıda duruma sahip bir makine olan bir elektronik dijital hesaplama cihazının çalışması, program tarafından belirlenir ve programcı tarafından içine girilen veriler.
Bir kişinin sonlu sayıda duruma sahip bir makine olduğunu ve bu makinenin işlevlerinin mesaj oluşturmakla sınırlı olmadığını hayal etmek oldukça doğaldır. İsterseniz, sinir sistemi hücrelerinin tüm olası konfigürasyonlarının ve olabilecekleri tüm olası koşulların (örneğin beynin) durumları olduğunu düşünebiliriz. Bir halden başka bir hale geçişin bazen bir harfin, kelimenin, bir sesin ya da bir kısmının yaratılmasıyla, bazen de başka bir fiilin ya da hareketin bir kısmının oluşmasıyla birlikte olduğu düşünülebilir. Görme, duyma, dokunma ve diğer duyuları makinenin bir sonraki hangi duruma gireceğini belirleyen girdiler olarak düşünebiliriz. Ancak, eğer bir kişi sınırlı sayıda duruma sahip bir makineyse, o zaman durumların sayısı fantastik olmalı ve matematiksel araştırmaya uygun olmamalıdır. Doğru, gaz moleküllerinin konumlarının sayısı da harika, ancak yine de bir gazın birçok önemli özelliği basınç ve sıcaklık kavramlarıyla açıklanabilir. Bir şey yazarken veya bir şey yaparken beynin nasıl çalıştığını doğru ve basit bir şekilde formüle edebilecek miyiz? Gördüğümüz gibi, bir kişinin kağıda ne yazacağına dair istatistiksel kalıpları oldukça doğru bir şekilde tahmin etmek mümkündür, tabii ki orijinal olmak istemiyorsa, ancak bu durumda onun için orijinalinden vazgeçmesi zor olacaktır. alışkanlıklar.
Bu bölümün amacı elbette çok daha dardır. Bir kişiyi mesajların kaynağı ve yarattığı mesajlar olarak yeterince tanımlayabilecek bir matematiksel model bulmak istedik. İngilizce metni örnek olarak alırsak, yazarın kasıtlı olarak bazılarından kaçındığı durum dışında, farklı harflerin tekrarlanma sıklığında şaşırtıcı bir tutarlılık fark ettik. Harf çiftlerinin, üçüzlerin vb. Tekrarlanma sıklığının yanı sıra çeşitli kelimelerin tekrarının da neredeyse sabit olduğu ortaya çıktı.
Ayrıca, çeşitli rasgele veya stokastik işlemler yoluyla, gerçek bir İngilizce metindekiyle aynı sıklıkta tek tek harflerin tekrarlandığı harf dizileri elde etmenin mümkün olduğunu da fark ettik. Büyük bir metin pasajını harflere (veya kelimelere) bölerek, bunları bir şapkaya koyarak ve karıştırarak stokastik bir süreç elde edilebilir; sonra şapkadan bir parça kağıt çekebilirsiniz. Stokastik süreci iyileştirerek, örneğin bir sonlu durum makinesi uygulayarak, İngilizce metne daha da iyi bir yaklaşım elde edilebilir.
Bu nedenle, bir mesaj kaynağı modeli olarak genelleştirilmiş bir stokastik süreci seçtik, örneğin İngilizce bir metin oluşturan bir kaynak. Ancak bir kaynak tarafından üretilen mesajların kodlanmasıyla ilgili teoremleri kanıtlamak için, ele aldığımız stokastik kaynağın matematiksel bir tanımını yapmak gerekir. Nasıl yapılır? İngilizce metnin doğasına uygun bir tanım seçmek gereklidir.
Mesajların kaynağı için model olarak seçtiğimiz stokastik kaynak, ergodik bir kaynaktır. Sonsuz sayıda veya sonsuz sayıda harf dizisi oluşturan bir tür hayali makine olarak düşünülebilir. Kabaca söylemek gerekirse, ergodik bir mesaj kaynağı tarafından oluşturulan bu harf dizilerinin uyduğu istatistiksel düzenlilikler zamanla değişmez, yani kaynak durağandır. Ayrıca ergodik bir kaynaktan gelen bir mesajın çalışmasında elde edilen istatistiksel düzenlilikler, bu kaynak tarafından üretilen tüm mesajlar için geçerlidir.
Matematiksel bağlantı teorisinin teoremleri, tamamen ergodik bir kaynak için titizlikle kanıtlanmıştır. İngilizce yazan herkes yaklaşık olarak ergodik bir metin kaynağı oluşturur. Kesin olarak ergodik bir kaynak olan matematiksel bir model, gerçeği oldukça iyi yansıtır, bu nedenle bu modelin çalışmasında geçerli olan matematiksel aparat çok faydalı olur. Ancak iletişimin matematiksel kuramının yalnızca kesin olarak ergodik bir kaynak için geçerli olan bu teoremlerini ve diğer sonuçlarını iletişimin hayati sorunlarına akıllıca ve dikkatli bir şekilde uygulamak gerekir.
Глава четвертая
KODLAMA
VE
İKİLİ İŞARETLER
Bilgi kaynakları farklı olabilir: basılı metin, konuşan bir kişi, bir orkestranın sesi, bir fotoğraf, film kareleri veya bir televizyon kamerasının hedefleyebileceği bir gösteri. Bilgi teorisinde bu tür kaynakların ergodik harf, sayı, sembol veya elektrik sinyali kaynaklarının özelliklerine sahip olduğunun kabul edildiğini zaten biliyoruz. Matematiksel iletişim teorisinin veya bilgi teorisinin ana görevi, bu tür harf dizilerinin veya
81
θ J. Pierce
diğer sinyaller, normalde telekomünikasyon tarafından gerçekleştirilen iletim için en verimli şekilde kodlanır.
Kodlar ve şifreleme mesajları olduğunu herkes bilir. Polisiye romanlardaki zeki casuslar kesinlikle gizli kodlar kullanır. Edgar Allan Poe, The Gold Bug adlı kısa öyküsünde, şifrelemenin temel tekniklerini popüler bir biçimde ortaya koydu. Genel olarak Amerika, birisi tarafından yazılmış şifreli bir mektubu okumaktan gerçek bir zevk alan kriptogram severlerle doludur.
Kodlar, önemli bir mesajın içeriğini, amaçlanmayan kişilerden gizlemek için kullanıldıklarında, tarihsel olarak kriptogramlar veya kriptografi biçiminde ortaya çıktı. Bu şu şekilde yapılabilir: bazı kelimeler yerine, kod koleksiyonunda belirtilen diğerleri ikame edilir. Sözde şifre kodu, önceden kararlaştırılan gizli bir ikame sistemine göre bazı harflerin yerine harfler veya sayılar getirildiğinde de kullanılabilir.
Kodlama kavramı (bir şeyin diğerinin yardımıyla tam olarak gösterilmesi) başka bilimlerde de bulunur. Genetikçiler, gelecekteki kişinin "planının" tamamen embriyo hücresinin kromozomlarına kaydedildiğine inanırlar. Örneğin, bu "metnin" DNA'daki (deoksiribonükleik asit) dört tip "baz" zResiminden oluştuğunu ve bir kromozom oluşturan kesin bir dizilimden oluştuğunu iddia ediyorlar. Ve bu metin, sırayla, RNA'daki eşdeğer metin ( ribonükleik asit) tarafından çoğaltılır ve bu metne dayanarak, yirmi tür amino asit dizisinden oluşan proteinler sentezlenir. RNA'nın taşıdığı dört harfli mesajın, proteinin yirmi harfli kodunda nasıl yazıldığını anlamak için çok çaba harcandı.
Ancak genetikçiler, bilgi teorisinin varlığı sayesinde bu yaklaşıma geldiler. Bilgi aktarımının incelenmesi, kodlama sorunlarına ilişkin yeni bir anlayışa yol açmıştır; bu, ister metnin kodlanması, ister genetik bilginin kodlanması olsun, her türü için eşit derecede önemli olan bir anlayıştır.
Bölüm 2'de , herhangi bir metnin Mors kodu sembolleriyle, yani kısa ve uzun duraklamalarla ayrılmış kısa ve uzun akım darbeleriyle kodlanabileceği gerçeğinden zaten bahsetmiştik. Bu, kodlamanın basit bir yoludur . Bilgi teorisi açısından , frekans modülasyonlu (FM) bir vericiden alıcınıza yayılan elektromanyetik dalgalar, iletilen müziğin kodlamasını temsil eder. Telefon tellerindeki elektrik akımı konuşmanın kodlanmasıdır ve konuşmanın ses dalgalarının kendisi de ses tellerinin titreşimlerinin kodlamasıdır. Seslerin ses telleri tarafından kodlanmasının bu son türü, doğanın kendisi tarafından önceden belirlenmiştir. Ancak iletişim mühendisi, harfleri temsil eden noktalar, çizgiler ve duraklamalardan bir kod seçebildiği gibi, sesin seslerini bir elektrik akımı yardımıyla göstereceği kodlama yöntemini seçmekte özgürdür. telgrafta alfabe. Ve tabii ki bu kodlamayı olabildiğince iyi yapmak istiyor. Bunu yapmak için, mühendisin iyi kodlamayı kötüden ayırt edecek bir standarda sahip olması ve ek olarak, iyi kodlamanın elde edildiği araçlarda gezinebilmesi gerekir. Bölüm 2'de bunun bir kısmını öğrendik .
Bu görünüşte sınırlı sorundan, herhangi bir kodlama için, özellikle kriptografi ve genetik için önemli olan yeni kavramlar ortaya çıkmıştır. Bu kavramlar, entropi kavramını - bilgi miktarının bir ölçüsü - ve biraz - bilgi miktarının bir ölçü birimini içerir.
Okuyucunun "bilgi miktarının" ne olduğunu ve ayrıca bitlerle ölçüldüğünü öğrenmek için şimdiden istekli olduğuna inanmak isterim. Ve umarım bu kutsal sabırsızlık, mesaj kodlama hakkında oldukça fazla orta düzeyde bilginin üstesinden gelmesine yardımcı olur.
Bana öyle geliyor ki, sorunun ne olduğunu hissetmeden bir sorunun çözümünü anlamak ve değerlendirmek mümkün değil. Tek bir müzik cümlesi bile duymamış bir insana müziğin ne olduğunu net bir şekilde anlatmak pek mümkün değil. Komşunuzun başına gelenlerle ilgili komik bir hikayenin son derece merak uyandırması mümkündür, ancak bir Hottentot üzerinde herhangi bir etki yaratmayacaktır. Yalnızca bir mesajın aktarım için nasıl kodlandığını ayrıntılı olarak anlayarak, bilgi miktarı ve anlamının bir ölçüsü kavramını tanıtma ihtiyacının takdir edilebileceğine inanıyorum.
Önemli kodlama problemleri en iyi şekilde basit ve somut örneklerle anlaşılır. Ancak biz bu yolda
bazı zorluklar bizi bekliyor: sonuçta basit örneklerle genel değeri olan bir şeyler öğrenmek istiyoruz.
Oldukça sık olarak, mesajlar, örneğin bir elektronik bilgisayarın çıkışındaki bir metindeki bir harf veya sayı dizisi gibi, ayrık karakter dizilerinden oluşur. Ancak, diğer mesajların onlardan önemli ölçüde farklı olduğunu görüyoruz.
Konuşma dili ve müzik, kulak yakınındaki hava basıncının zamanla değişimini temsil eder. Telefonda, basınçtaki bu değişiklik, tel boyunca yayılan sinyalin voltajındaki veya bunun başka bir özelliğindeki bir değişikliğe karşılık gelir. Böyle bir sinyalin yayılması, Şekil 1'de gösterilmektedir. 4.1, bir. Burada sinyal, dalgalı çizgi ile gösterildiği gibi zamanla değişen bir voltajdır.
, kesikli mesajların incelenmesinde olduğu gibi sürekli sinyallerin incelenmesine uygulanamazsa çok az değer taşır .
, örnekleme teoremi adı verilen bir matematik teoreminin ispatıyla başlar . Kanıt olmadan kullanacağız. Bu teorem, sürekli bir sinyalin tam olarak görüntülenebileceğini ve düzenli aralıklarla alınan bir dizi ölçümden veya sinyalin büyüklüğünün okunmasından doğru bir şekilde yeniden oluşturulabileceğini belirtir. Numuneler, sinyalde bulunan en yüksek frekansın periyodunun yarısına eşit veya daha az zaman aralıklarında alınmalıdır. Şekil 2'de gösterilen sinyalin büyüklüğünün bu tür bir dizi örneği; 4.1a, Şekil 1'de gösterilmiştir. 4.1, b çeşitli uzunluklarda dikey bölümler.
Okumaların sinyali iyi bir doğrulukla yansıtması için oldukça sık alınması gerektiğine özellikle dikkat edilmelidir. 0 ile 4000 arasındaki frekansları içeren bir konuşma sinyali için saniyede 8000 örnek alınmalıdır . Televizyon sinyalinde 0 ile 4 MHz arasında frekanslar vardır ve bu nedenle saniyede 8.000.000 örnek alınması gerekir. Genel olarak konuşursak, bir sinyalin frekans aralığı / ise, bu sinyali doğru bir şekilde tanımlamak için saniyede en az 2 / örnek alınmalıdır.
Bu nedenle, örnekleme teoremi, birbirinden genlik olarak farklı olan bir dizi örnek kullanarak düzgün bir şekilde değişen bir sinyal görüntülememizi sağlar. 84
Zaman —» ⅜ Şek. 4.1.
Bununla birlikte, okuma sırası ile harf ve sayıların sırası arasında hala önemli bir fark vardır. İngiliz dilinde yalnızca on sayı, yirmi altı harf vardır ve okumaların genişliği sonsuz sayıda değere sahip olabilir. Başka bir deyişle, okuma genliği sürekli bir aralıktan herhangi bir değer alabilirken , harfler veya sayılar yalnızca sınırlı sayıda ayrık değere sahiptir.
Bilgi teorisinin sürekli genliğe sahip sayımlarla ilgilenme yöntemi kendi içinde ilginçtir. Daha sonra geri döneceğiz. Burada sadece, sinyali doğru bir şekilde yeniden üretmenin kesinlikle gerekli olmadığını belirtmek isterim. Gerçekte, gerçek fiziksel cihazlar, sinyali tam olarak doğru bir şekilde yeniden üretmeyi hala mümkün kılmamaktadır . Bu nedenle, konuşmayı iletirken, yaklaşık% 1'lik bir doğrulukla okuma yapmak yeterlidir . Bu nedenle, konuşma sinyali örneklerinin genliklerini tarif ederken, isteğe bağlı olarak kendimizi 0 ila 99 arasındaki tamsayılarla sınırlayabilir ve belirli bir örneğin genliği olarak, genliğin gerçek değerine en yakın olan yüz üzerinden sayıyı dikkate alabiliriz. Sinyal örneklerinin bu şekilde nicelenmesi, ayrı bir basılı metnin temsiline benzer bir temsilin elde edilmesini sağlar.
Örnekler alarak ve sürekli bir sinyali niceleyerek, kodlama problemi, bir ayrık karakter dizisini kodlama gibi daha basit bir probleme indirgenebilir.
Bölüm 2 , Mors kodunun İngilizce metni heceleyebileceğini kaydetti. Aynı
Şekil 4.2.
mesajın teleyazı ile iletilme şekli. Verici cihazın herhangi bir düğmesine basarak, alıcı cihaza ulaşacak, daktilonun ilgili tuşunu çalıştıracak ve iletilen karakter yazdırılacak olan devre boyunca belirli bir dizi elektriksel impuls ve duraklama göndeririz.
Darbelerin ve duraklamaların birleşimi, mesajları kodlamanın çok yaygın ve kullanışlı bir yoludur. Mors kodunda ve teletip kodunda darbeler ve duraklamaların farklı süreleri olsa da, düzenli aralıklarla aynı süredeki darbe ve duraklama dizilerini göndererek mesajların iletilmesi oldukça mümkündür. Resimde. 4.2, bu tür iki diziyi göstermektedir. Resimde. 4.2 ve dizi şu forma sahiptir: darbe-duraklat-duraklat-darbe-duraklat-darbe ve Şekil 1'de. 4.2, b - nabız-nabız-nabız-duraklat-nabız-nabız.
Belirli bir aralıkta bir darbenin veya duraklamanın varlığı, iki olasılıktan birini gerçekleştirir. Şekil 2'de gösterilen darbelerin ve duraklamaların sırasını kaydetmek için. 4.2, herhangi bir karakter çifti kullanılabilir: evet, hayır; +, -; 1, 0. Örneğin, ŞEK. 4.2, ancak şu şekilde yazılabilir:
1 ve 0 sayılarını kullanan gösterim özellikle pratik ve kullanışlıdır. Darbe dizisini ikili sayı sisteminde ifade edilen bir sayı ile eşleştirmek için kullanılabilir .
sayısı yazılırsa, bu şu anlama gelir:
3×10 2 + l×10 1 + 5×l =
\u003d 3 × 100 + 1 × 10 + 5x1 \u003d \u003d 315. . . -
Ondalık olarak adlandırılan bu sıradan sayı sisteminde on basamak kullanırız: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Binary'de yalnızca iki basamak kullanırız: 0 ve 1 . 100101 yazıyoruz , bunun anlamı
1×2 5 + 0×2 4 + 0×2 3 +l×2 2 + 0×2 + l× Ben = '
= 1 X 32 + 0 X 16+ 0 X 8 +1 X 4 +0 X 2 +1 X 1 =
= 37 ondalık olarak.
Bir sayının önüne sıfır koymak genellikle uygundur, ancak bu onun değerini değiştirmez. Ondalık olarak şöyle görünür:
0016 = 16
ve bunun gibi ikili olarak:
001010=1010,
İkili olarak yazılan sayılarda, her sıfır ve her biri ikili basamaklardır (veya işaretlerdir). Ardışık altı aralıkta görünen darbelerin ve duraklamaların sırasını tanımlamak için altı ikili karakter dizisi kullanılabilir. Her bir zaman aralığındaki bir darbe veya duraklama bir ikili işarete eşdeğer olduğundan, tüm darbe grubu altı ikili işaret olarak kabul edilebilir veya bir aralıkta görünen her darbe ve duraklama ayrı bir ikili işaret olarak kabul edilebilir.
Darbeleri ve duraklamaları üç aralıkta kaç şekilde düzenleyebileceğinizi görelim. Başka bir deyişle, kaç tane üç basamaklı ikili sayı vardır? Hepsi Tabloda verilmiştir. 6.
Tablo 6
Solda, ikili sayılar olarak kabul edilen sıfır ve bir dizileri ve sağda karşılık gelen ondalık sayılar var.
8 adet üç basamaklı ikili sayı olduğunu görüyoruz . Ama 8, 2 3'tür . Aslında, n ikili karakterden oluşan sırayla yazılan dizilerin ikili sayılar olarak kabul edilebileceği ve 0 dahil ikili sayıların sayısının 2 n'ye eşit olacağı ortaya çıktı . Örnek olarak, Tabloda. Şekil 7, farklı sayıda n ikili karaktere karşılık gelen kaç farklı dizinin olduğunu göstermektedir .
Gördüğünüz gibi, ikili karakterlerin sayısı arttıkça farklı dizilerin sayısı da çok hızlı artıyor. Bunun nedeni, her bir basamak eklendiğinde, olası dizilerin sayısının ikiye katlanmasıdır, çünkü bir basamak ekleyerek tüm eski dizileri iki kez elde edeceğiz ve ilk durumda, ikinci birimde sıfırdan önce gelecekler.
Tablo 7
! İkili ve ondalık sistemler tek değildir
olası sayı sistemleri Bilgisayar kullananlar için sekizli sistem çok önemli hale geldi. Sekizli sistemin sekiz basamaktan oluştuğunu varsayabiliriz: 0, 1, 2, 3, 4, 5, 6, 7.
356 sayısı sekizlik sistemde yazılmışsa, bu şu anlama gelir:
BEN; 3x8 2 + 5x8 + 6x1 =
= 3 × 64-f-5 × 84-6 × 1 = = 238 ondalık.
İkiliyi sekizliye çevirmenin ve tam tersini yapmanın çok basit bir yolu var. Bunu yapmak için, yalnızca üç ikili basamaktan oluşan her bir grubu, sekizli sayı sistemindeki karşılık gelen basamakla sırayla değiştirmek gerekir:
İkili OLO Hasta Ol 110
sekizli 2 7 3 6
? Bilgisayarlarla çalışanlar ve ikili sayı sistemini kullanmak zorunda olanlar, sekizli sistemde kısa sayı dizilerini ezberlemenin ve yazmanın, uzun ikili karakter dizilerinden çok daha kolay olduğunu keşfederler. Ardışık üç ikili basamak kümesini tek bir bütün olarak düşünmeye alışırlar, on iki ikili basamaktan oluşan bir diziyi bu tür dört küme biçiminde, yani sekizli sistemin dört basamağı biçiminde hayal etmeyi öğrenirler.
0, 1, 2, 3, 4, 5, 6, 7) sahip bir darbe dizisinin karşılık gelebileceğini not etmek ilginçtir. sekizli basamak dizisine. Bu, Şekil l'de gösterilebilir. 4.3. Resimde. 4.3, a, açık - kapalı veya aynı olan 0-1 tipinde bir darbe dizisini gösterir. Bu dizi, ikili sayı 010111011110'a karşılık gelir . Sekizlikteki karşılık gelen sayı 2736'dır ve ŞEK. 4.3.6 J genlikleri 2, 7, 3, 6 olan dört akım darbesinden oluşan bir dizi ile gösterilir .
Фиг. 4.3.
в 6 4 Z О
İkili bir sayıyı ondalık sayıya dönüştürmek kolay değildir. Bir ondalık basamağı ikili olarak yazmak için ortalama yaklaşık 3,32 ikili basamak gerekir. Elbette, tabloda gösterildiği gibi, ondalık sistemin her basamağını dört ikili karakter dizisini kullanarak tanımlayabilirsiniz. 8, ancak aynı zamanda, gereğinden fazla olduğu için bazı diziler gereksiz olacaktır.
Sıfırlar ve birler dizileri, yani darbeler ve duraklamalar dizisi, uygun şekilde ikili sayılar olarak kabul edilir. Bu, farklı uzunluklarda kaç dizi olduğunu ve ikili sistemde yazılan sayılar ile sekizlik veya ondalık sistemde yazılan sayılar arasındaki yazışmanın ne olduğunu bulmaya yardımcı olur.
Tablo 8
Tablo 9
Ancak bilgi aktarılırken sayıların ikili karakter dizisi şeklinde yazılması konu ile doğrudan ilgili değildir. Dolayısıyla, yalnızca sekizli basamakların görüntüsünü iletmekle ilgileniyorsak , bu sayılar artık Tablodan belirlenemez. 6 ve Tabloya göre. 9.
Burada sol sütundaki “binary sayılar” Tablodakinden tamamen farklı sayılara karşılık gelmektedir. 6.
Aslında, ikili karakterler ile sekizli basamaklar gibi diğer semboller arasındaki böyle bir yazışma biraz farklı bir şekilde düşünülebilir. Bir ikili karakter dizisi, bir ikili sayının parçası olarak değil, belirli bir karakteri seçmek veya tanımak için bir araç olarak düşünülebilir.
Her sıfır veya bir, iki olasılık arasında temel bir seçim olarak görülebilir. Örnek olarak, ŞEKİL 2'de gösterilen "kod ağacını" ele alalım. 4.4. Kökten dallara yükseliyoruz.
1 - sağda gitmeniz gerektiği anlamına gelsin . Ardından Oll dizisi, hareket etmenin bir sonraki yolunu belirleyecektir: sol, sağ, sağ. Tabloya göre bizi yönlendirecektir. 9 ila 6 sekizli.
Nasıl ki üç ikili basamak bize sekiz olasılıktan birini belirlemek için yeterli bilgiyi veriyorsa, dört ikili basamak da bize on altı olasılıktan birini ve 1.048.576 olasılıktan yirmi birini verir . Bu, olasılıklara keyfi bir sırada ikili sayılar atayarak yapılabilir.
Elbette, ikili karakter dizileri olarak göstermek istediğimiz olasılıkların sayı olması hiç de gerekli değildir. Ne de olsa, sırayla ikili karakterlerle görüntülenebilen bir dizi elektriksel darbe ve duraklama kullanarak İngilizce metni iletim için nasıl kodlayacağımızla başladık.
İngilizce metni hecelemek için gereken minimum süre 26 harf artı bir duraklamadır ( toplamda 27 karakter). Bu durumda, elbette, Arap rakamları ve noktalama işaretleri yok. Gerekirse, sayılar kelimelerle (üç, ancak 3 değil) ve noktalama işaretleriyle (nokta, virgül, iki nokta üst üste vb.) Yazılabilir .
Matematik, yirmi yedi karakterden birini seçmenin yaklaşık 4.75 ikili karaktere karşılık geldiğini söylüyor. Kod verimliliği önemli değilse, her karakter 5 basamaklı bir ikili sayı olarak görüntülenebilir ve 5 sayı kullanılmadan kalır.
Daktilomun büyük harfli tuşu ve kilidi dahil 48 tuşu var. İki "karakter" daha eklenebilir, bir satır başı kolu ve bir satır besleme kolu, toplamı 50'ye getirir ( kağıt ekleme) - 50 karakter kullanılarak ve bunların her biri 5.62 ikili karaktere karşılık gelir . Karakter başına 6 ikili karakter kullanmak mümkün olacaktır , ancak bu durumda birkaç ikili karakter dizisi gereksiz olacaktır.
Otuz iki 5 basamaklı ikili sayı çok az olduğu için fazladan diziler görünecektir, 92
ve altmış dört 6 basamaklı sayı çok fazla. Bu tür kayıplardan nasıl kaçınılır? 50 karakter varsa , her biri üç karakterden oluşan 125.000 farklı grup elde edebilirsiniz . 17 ikili karakterin 131.072 farklı kombinasyon verdiği bilinmektedir . Bu nedenle, metin üç karakterlik bloklara bölünürse , herhangi bir blok 17 basamaklı bir ikili sayı olarak görüntülenebilir ve hala kullanılmayan bazı karakterler kalır. Her karakteri altı ikili karakterle gösterecek olsaydık, ardışık üç karakter 18 ikili karakter gerektirirdi. Böylece blok kodlama , belirli bir uzunluktaki metni kodlarken kullanılan ikili karakterlerin sayısını azaltır. Azaltma faktörü 17/ 18'dir .
Elbette İngilizce metni başka bir şekilde kodlayabilirsiniz. 16.357 kelimelik bir İngilizce sözlüğün yardımıyla çok şey söylenebilir . Bu oldukça büyük bir kelime dağarcığı. Tam olarak 16.384 14 basamaklı ikili sayı vardır . Bunlardan 16.357'si çeşitli faydalı kelimelere, 27'si alfabedeki harflere ve kelimeler veya harfler arasındaki boşluklara atanabilir, böylece sözlüğümüzde olmayan herhangi bir kelimeyi, hatta bir bütünü heceleyebiliriz. bu kelimelerden cümle Genellikle kelimeleri bir boşlukla atanan belirli bir sayı ile ayırmaya gerek yoktur; Her kelimeden sonra bir boşluk olması gerektiği varsayılabilir.
her kelime için yaklaşık 14 ikili karakter olacaktır . Normal İngilizce metinde her kelime ortalama 4,5 harften oluşur. Mesaj hecelenmişse, her kelimenin bir boşlukla ayrılması gerekir ve bu nedenle, büyük harf ve noktalama işaretleri ihmal edilse bile, kelime başına ortalama 5,5 karakter alacaktır. Her karakter beş ikili karakterle kodlanırsa, kelime başına ortalama 27,5 ikili karakter olacaktır , mesajın tüm sözcüklerini bir kerede kodlarken, sözcük başına yalnızca 14 ikili karakter gerekir.
O nasıl çalışır? Mesele şu ki, bir mesajı mektupla ileterek, bu harflerden oluşan herhangi bir diziyi iletebilirsiniz ve tüm kelimeleri bir kerede ileterek kendimizi belirli bir dilin kelimeleriyle sınırlıyoruz.
Metni görüntülemek için gereken kelime başına ortalama ikili karakter sayısının büyük ölçüde kodlama yöntemine bağlı olduğu artık açıktır.
Ancak metin, iletmek istediğimiz mesaj türlerinden yalnızca biridir. Diğer mesajlar bir sayı sütunu, bir insan sesi, film kareleri, fotoğraflar olarak sunulabilir. Metni kodlamanın verimli ve verimsiz yolları olduğu gibi, muhtemelen diğer sinyalleri kodlamanın da verimli ve verimsiz yolları olacaktır.
, belirli bir kaynağın sinyallerini kodlamanın en iyi yolunun, karakter başına ortalama olarak diğer herhangi bir yoldan daha az ikili karakter gerektiren bir yol olduğuna inanmak zor değil .
saniyede ürettiği bilgi miktarının bir ölçüsü olarak kullanılabilir .
Bilgi teorisinde yapılan da tam olarak budur. Bunun nasıl yapılacağı bir sonraki bölümde daha ayrıntılı olarak tartışılacaktır.
Şimdi bu bölümden öğrendiklerimizi kısaca gözden geçirelim. Matematiksel iletişim teorisindeki kodlama, çok geniş bir şekilde - bir sinyalin diğerine eşlenmesi olarak anlaşılır. Böylece radyo dalgalarının yardımıyla bir sesin seslerini görüntüleyebilir, yani kodlayabilirsiniz. Ancak kodlamayı açıklamanın en kolay yolu, alfabetik veya sayısal dizilerden oluşan mesajlar oluşturan ayrık kaynaklar örneğidir. Bir telefon hattındaki akım gibi sürekli bir sinyalin, büyüklüğünün örnekleriyle temsil edilebilmesi ve saniyede alınacak örnek sayısının, mevcut en yüksek frekansın değerinin en az iki katı olması çok şanslı. sinyal. Gerekirse, her örneğin genliğini bir tamsayı ile yaklaşık olarak da tahmin edebiliriz.
Matematiksel iletişim teorisi veya bilgi teorisi için özellikle ilgi çekici olan, harflerin veya sayıların bir açma-kapama sinyalleri dizisiyle gösterilmesidir; , dört ikili basamak dizisi kullanılarak 16 ikili sayı elde edilebilir ve bunlardan 10 tanesi 10 ondalık basamağı görüntülemek için kullanılabilir . Beş ikili basamak dizisi ile 32 ikili sayı elde edilebilir ve bunlardan 27'si İngiliz alfabesinin harflerini ve bir boşluğu görüntülemek için kullanılabilir. Böylece on-off sinyal dizileri göndererek ondalık basamakları veya İngilizce metni iletmek mümkündür.
Bu ikili karakter dizilerini ikili sayılar olarak düşünmek uygun olsa da, bunun kendi başına çok az önemi olduğuna dikkat edilmelidir; belirli bir ondalık basamağı görüntülemek için herhangi bir ikili sayı seçilebilir.
On ondalık basamağı kodlamak için 16 olası 4 basamaklı ikili sayıdan 10'u kullanılırsa , 6 sayı gereksiz olacaktır. Bu diziler, bir açma-kapama sinyalleri dizisi kullanılarak iletilebilir (bu asla yapılmasa da). Kayıpları önlemek için blok kodlama uygulayabilirsiniz, yani iki, üç veya daha fazla ondalık basamaktan veya ikili karakterli diğer karakterlerden oluşan dizileri kodlayabilirsiniz. Örneğin, üç ondalık basamaktan oluşan herhangi bir dizi, on ikili basamakla görüntülenebilirken, üç basamaktan her birinin ayrı ayrı görüntülenmesi 12 ikili basamak gerektirir.
Ondalık basamaklardan herhangi bir dizi oluşturulabilir, ancak İngilizce harflerden yalnızca İngilizce dilindeki sözcükler olan diziler oluşturulur ve genellikle bulunur. Bu durumda, harfleri değil, tüm İngilizce kelimeleri bir kerede ikili karakterlerle kodlamak daha verimli olur. Bu, her karakteri ayrı ayrı değil, tüm karakter dizisini bir kerede kodlamanın daha karlı olduğunu bir kez daha vurgulamaktadır.
Bütün bunlar, en az miktarda ikili karakter gerektiren bir kaynaktan alınan mesajları kodlamanın en iyi yolunun var gibi göründüğünü gösteriyor.
ENTROPİ
Önceki bölümde, mesajları kodlamanın çeşitli yollarına baktık. Sonuçta, herhangi bir iletişim yöntemiyle, bir tür mesaj kodlaması kaçınılmazdır. Bu nedenle, telekomünikasyonda harfler, Edison'un dörtlü telgrafında olduğu gibi, noktalar veya çizgiler biçimindeki akım darbeleriyle veya farklı büyüklük ve kutuplardaki akım darbeleriyle kodlanabilir. Mesaj ayrıca ikili sıfırlar ve birler dilinde kodlanabilir ve ardından bir darbe ve aralık dizisi olarak iletilebilir.
Bir konuşma gibi sürekli bir sinyali periyodik olarak ölçerek (belirli bir okumanın genliği olarak bir dizi ayrık değerden en yakınını alarak), sürekli bir sinyali görüntülemenin veya kodlamanın bile mümkün olduğunu gösterdik. , bir ikili basamak dizisi olarak.
Belirli bir mesajı kodlamak için gereken basamak sayısının kodlama yöntemine bağlı olduğunu da gördük. Yani, tüm bir grubu kodlamak için veya. blok, harfler ve her harf ayrı ayrı değil, daha az ikili rakam gerekli olacaktır. Tüm harfleri bir kerede kodlamak daha da önemlidir, çünkü tüm harf kombinasyonları anlamlı kelimeler vermez. Bu kodlama yöntemiyle, aynı metni harf harf kodlamaya kıyasla önemli ölçüde daha az rakam gerekir.
Hiç şüphesiz, bazı ergodik kaynaklar tarafından üretilen mesajları kodlamanın başka yolları da vardır; örneğin, ergodik bir İngilizce metin kaynağı. Her harf veya kelime için gerçekte kaç ikili basamak gereklidir? Bu soruyu açıklığa kavuşturmak için tüm kodlama yöntemlerini araştırmak gerekli midir? Ancak böyle bir araştırmaya başlasak ve tüm kodlama türlerini ve yöntemlerini sırayla incelesek bile, o zaman en iyi kodlama yolunu bulduğumuzdan emin olmayacağız çünkü henüz keşfetmemiş olabiliriz.
En azından prensipte, kaynak tarafından üretilen bir mesajı işlemek için, sonucu bize kaynak tarafından üretilen mesajları kodlamak için gereken karakter başına minimum ortalama ikili basamak sayısını söyleyecek istatistiksel bir yöntem var mı? √
3'te tartışılan mesaj kaynağı modeline dönmeliyiz. Orada, mesajların kaynağının harfler veya kelimeler gibi ergodik bir sembol kaynağı olduğunu düşündük. Böyle bir ergodik kaynağın bazı değişmez istatistiksel özellikleri vardır: sembollerin sabit bir göreceli tekrar sıklığı, belirli bir sembolün ardından belirli bir başka sembolün (veya bir çift, üçlü vb. sembol) gelmesine ilişkin sabit bir olasılık, vb.
Aynı şekilde, metinde kelimelerin görünüşünün göreli sıklığının sabitliği ve sabitliği hakkında konuşabiliriz.
7 J. Piro 97
Belirli bir kelimenin ardından belirli bir başka kelimenin, belirli bir çiftin, üçlünün veya başka bir kelime kombinasyonunun gelmesi kuvvetle muhtemeldir .
Harf ve kelime dizilerinin istatistiksel özelliklerini göstererek, harflerin veya kelimelerin rastgele seçilmesinin (bunların ya tam olarak ortaya çıkma olasılıklarına göre ya da olma olasılıklarına göre seçilmeleri koşuluyla) nasıl olduğunu gösterdik. önceki harf veya kelime sırasını takip ederek) gerçek bir metne benzeyen materyal elde edebilirsiniz. Bir sonraki sembolü farklı şekillerde "seçebilirsiniz": zar atın veya üzerlerinde bir harf yazılı olan kartları bir şapkadan çıkarın.
Böyle bir seçime benzer bir şey - ne yazacağımız veya sonra ne söyleyeceğimiz - her gün yazarken veya konuşurken yaparız. Bazen başka seçenek yoktur; İngilizce metinde Q harfinin ardından her zaman U harfi gelmelidir. Bir kelimenin başında, ortadakinden çok daha fazla seçenek vardır. Öyle olsa bile, canlı veya mekanik herhangi bir mesaj kaynağında sürekli bir seçim yapılıyor. Bu olmazsa, kaynak tarafından üretilen mesajlar önceden belirlenmiş ve tamamen tahmin edilebilir olacaktır.
Kaynak, ileti oluştururken bir seçim yaptığı için, hedef belirsizliğe sahiptir. Muhatap mesajı incelediğinde bu belirsizlik giderilir. Bu belirsizliğin çözümü, iletişim sürecinin amacı ve sonucudur.
Eğer mesajın kaynağında başka seçenek olmasaydı ve diyelim ki kaynak sonsuz uzun bir dizi birler ya da sonsuz uzun bir sıfırlar dizisi üretebilseydi, alıcı bulmak için mesajı kabul etmeye ya da incelemeye ihtiyaç duymazdı. İçeriğini ortaya çıkarın. : Bunu önceden tahmin edebilirdi. Bu nedenle bilgiyi en uygun şekilde ölçmek için kaynaktaki seçenekler arttıkça ve dolayısıyla kaynağın ne tür bir mesaj oluşturduğu ve ilettiği konusunda destinasyonun belirsizliği arttıkça artan bir ölçüme sahip olmamız gerekir.
Tabii ki, herhangi bir kaynak kısa dizilerden çok daha uzun diziler oluşturabilir. Evet, 98
2 mesaj bir ikili haneden, 4 tanesi iki haneden , 16 tanesi dört haneden , 256 tanesi sekiz haneden vb. oluşabilir. Bu tür mesajların sayısını bilgi miktarının bir ölçüsü olarak almamız gerekmez mi? Aşağıdaki durumu göz önünde bulundurun: iki nokta arasındaki dört telgraf hattı, ikili sayıları aynı anda ve aynı oranda iletir. Dört telgraf hattı , aynı zaman diliminde bir hattan 4 kat daha fazla ikili rakam iletebilir. Bu nedenle, dört hat üzerinden dört kat daha fazla bilginin iletilebileceğini varsaymak oldukça doğaldır . Hy ve öyleyse, o zaman bilgi, bu ikili basamak sayısından oluşturulabilecek farklı mesajların sayısıyla değil, ikili basamak sayısıyla ölçülmelidir. Yani bilgi miktarı olası mesajların sayısı ile değil, bu sayının logaritması ile ölçülmelidir.
Bilgi kuramında bilgi miktarının ölçüsü tam olarak bu şekilde ortaya konulmuştur ve böyle bir tanım başka nedenlerle de makuldür. Bilgi miktarının bu ölçüsüne entropi denir. Bilgi teorisinde entropinin ne olduğunu anlamak için, fizikte kullanılan entropi kavramıyla bir şekilde bağlantılı olan her şeyi kafanızdan atmak daha iyidir. Bilgi teorisinde entropinin ne olduğunu anladıktan sonra, onu fizikteki entropi ile ilişkilendirmeyi deneyebilirsiniz. Ancak bu konudaki literatürden bazı yazarların bu iki kavramın daha önce karıştırılmasının yarattığı kafa karışıklığından kurtulamadığı açıktır.
Bilgi teorisindeki entropi bitlerle ölçülür . Bir mesaj kaynağının entropisinin harf, kelime veya mesaj başına şu kadar bite eşit olduğunu söyleyebiliriz. Kaynak karakterleri sabit bir oranda oluşturuyorsa, mesaj kaynağının entropisinin saniyede çok fazla bit olduğu söylenir.
Kaynağın içinden seçim yapabileceği mesaj sayısı arttıkça entropi artar. Ayrıca seçim özgürlüğü (veya muhatabın belirsizliği) arttığında artar, ancak seçim özgürlüğü ve belirsizliğin sınırlı olduğu durumlarda azalır. Örneğin, belirli mesajların ya çok sık ya da çok nadiren iletilmesi gerektiğine dair bir kısıtlama, kaynak seçimini ve varış yerleri için determinizmi azaltır ve sonuç olarak, böyle bir kısıtlama entropiyi azaltmalıdır.
Entropiyi önce basit bir örnekle açıklayalım. Matematiksel iletişim teorisinde, mesajların kaynağı, bir dereceye kadar öngörülemeyen bir sembol dizisinin yaratılmasının bir sonucu olarak ergodik bir süreç olarak ele alınır. Mesajların kaynağının belirli bir mesajı rastgele, yani öngörülemeyen bir şekilde seçtiğini, ancak bunun ergodik olması gerektiğini hayal etmeliyiz. Basit olması için kaynak iki karakterden birini seçebilir: X veya Y ve önceki seçim sonrakini etkilemez. Bu durumda, sadece para çekme oyununda olduğu gibi X'in j p 0 olasılıkla ve Y'nin p 1 olasılıkla seçileceğini biliyoruz . Bu olasılıklar, kaynak tarafından üretilen yeterince uzun bir sembol dizisi incelenerek belirlenebilir. Kaynak ergodik ise, olasılıklar p 0 ve p i zamanla değişmemelidir.
Bu en basit durumda, mesaj kaynağının entropisi H şöyle tanımlanır:
I == - (po lθg Po÷ Pi Iog P1) sembol başına bit.
Böylece entropi, ters işaretle alınan iki çarpımın toplamıdır: X sembolünün seçileceği (veya elde edileceği) olasılığı p 0 , logaritma p 0 ile çarpılır ve p i olasılığı Y sembolünün seçileceği (veya alınacağı), aynı olasılığın logaritması ile çarpılması p 1 .
Bu ve daha karmaşık durumlarda entropinin bu özel tanımının lehinde hangi güçlü argümanlar sunulursa sunulsun, bu formülü seçmemizin gerçek nedeni ancak gelecekte ortaya çıkacaktır ve bu nedenle açıklaması şu şekilde olacaktır; biraz ertele Logaritmaların farklı olabileceğini ve bilgi teorisinde 2 tabanında logaritma kullandığımızı tekrar hatırlayın. 2 tabanındaki bazı sayıların logaritmaları Tablo'da verilmiştir. 10.
2 tabanlı logaritması, o sayıyı elde etmek için 2'nin yükseltilmesi gereken kuvvettir .
Bir "mesaj kaynağı" örneği olarak, adil bir atış oyunu düşünün. X kartal olsun ve Y olsun
Tablo 10
kuyruklar. olasılık pi _ rota 1 / 2'ye eşittir , olasılık P 0 kuyruklar da 1 / 2'ye eşittir . Entropi için ifademize ve Tabloya uygun olarak. 10 bul
Zf=-( 1 ∕ 2 10g 1 ∕2 + 1 ∕2 Iog 1 /2), ^ r = — P∕ 2 (-1) + 1 ∕2(-1)], H=I atma vuruşu
tura mı yoksa yazı mı geldiğini bildirmek için bir bitlik bilgi gerekir .
7 kez atılmasının sonucu, sayıları sayılarına eşit olan bir dizi ikili basamak olarak gösterilebilir. savurma Bu nedenle, en azından bu durumda, entropi ( her atışta 1 bit) ve bir atışın sonucunu temsil eden ikili basamak sayısı ( her atışta 1 ikili rakam) aynıdır. Ve en azından bu durumda, kaynak tarafından oluşturulan mesajı (bir tura ve yazı dizisi) iletmek için gereken ikili basamak sayısı, kaynağın entropisine eşittir.
3 / 4 י atma durumlarında tura düşecek ve yalnızca 1 / 4'te olacak şekilde dağıtılan mesajlar oluşturmak için bir madeni para kullanalım. vakalar - kuyruklar. Daha sonra
Pl = 3 Z 4 .
Po = 1 Z 41
ben= -( 1 Z 4 10g¼ ÷ 3 Z 4 Iog 3 Z 4 ),
ben = - [( 1 Z 4 ) (- 2) + ( 3 Z 4 ) (-0.415)],
I = atış başına 0,811 vuruş.
Sezgisel olarak açıktır ki, eğer turalar yazılardan daha sık düşüyorsa, o zaman atışların sonucu hakkında önceden, tura veya yazının eşit olasılıkla olduğu duruma göre daha fazla şey bilinir. Ayrıca, yazı yerine tura seçmek zorunda kalsaydık, tura veya yazı gelme olasılığının eşit olduğu duruma göre daha az seçeneğimiz olurdu. Durumun böyle olması gerektiğini düşünüyoruz, çünkü tura gelme olasılığı bir ve yazı gelme olasılığı sıfır olsaydı, o zaman hiçbir seçeneğimiz olmazdı. Aslında, yukarıdaki örnekte entropi, atış başına yalnızca 0,811 bittir. Açıkçası, böyle bir madeni paranın atılmasından kaynaklanan diziyi görüntülemek için, atış başına bir ikili basamaktan daha az zaman alacaktır, ancak bunun kaç ikili basamak gerektirdiği hemen belli değildir.
J p 1 tura seçme olasılığını belirtirsek , o zaman j p 0 yazı seçme olasılığı elbette 1 - p i'ye eşit olmalıdır . Böylece, eğer p ben bilinen, ardından Pq 9 H hesaplanabilir farklı p i değerleri için ve bir H grafiği çizin p i'den . _ Böyle bir eğri Şekil l'de gösterilmiştir. 5.1. Maksimum bire eşittir, H j p 1'de 0,5'e eşittir ve j p 1'de 0 veya 1'e eşittir , yani mesaj kaynağı her zaman iki karakterden yalnızca birini oluşturuyorsa kaybolur . Kura atışının hangi sonucunun tura, hangisinin yazı olduğunun önemi yoktur. Bu nedenle, aynı eğri H bağımlılığını gösterir. p 0'dan ve p i'nin üzerinde olduğu noktalı çizgiye göre simetrik olduğu ortaya çıkıyor ve p 0 , 0.5'e eşittir .
Gerçek bir mesaj kaynağı on ondalık basamaktan ardışık seçimler yapabilir, 102
Resim. 5.1.
veya İngiliz alfabesinden yirmi altı harf veya İngiliz dilinde binlerce kelime. Kaynağın n karakterden birini veya n kelimeden birini ürettiği durumu düşünün ve karakterlerin olma olasılıklarının önceki seçimlerden bağımsız olmasına izin verin. Bu durumda entropi şu şekilde tanımlanır:
P
I == - Sembol başına 2 Pjlog j Pi biti. (5.1) 2=1
Burada 3 toplamın işaretidir; farklı indekslere sahip tüm terimlerin eklenmesi gerektiği anlamına gelir; pi_ _ i'nci sembolün seçilme olasılığıdır. 2 işaretinin altındaki ve üstündeki i ≈ 1 ve n yazıtları , i'nin aşağıdaki değerleri alabileceğim anlamına gelir : 1, 2, 3 , vb. 7r'ye kadar, yani entropiyi hesaplamak için ADD P!10gp 1 C yapmanız gerekir P210gP2 Etc. tek bir dizini kaçırmadan 7g'ye kadar. 7r = 2 için daha önce ele alınan en basit durumu elde ettiğimiz açıktır .
Bir örnek alalım. Şimdi iki madeni para aynı anda atılsın. Dört olası sonuç vardır; Onları 1'den 4'e kadar sayılarla göstereceğiz :
OO veya 1
OP veya 2
PO veya 3
PP veya 4
madeni para) , o zaman her sonucun olasılığı 1/4 ve entropi
ben \u003d - (V 4 Iog V 4 + V 4 Iog V 4 + V 4 Iog V 4 + V 4 lθg V 4 ) , i \u003d - (-V 2 -V 2 -V 2 -V 2 ),
I = İki atışta 2 vuruş.
Bu tür iki madeni paranın aynı anda atılmasının sonucunu kaydetmek veya iletmek için 2 bitlik bilgi gereklidir. Yazı ve tura gelme olasılığının eşit olduğu tek bir yazı tura atma durumunda olduğu gibi, iki yazı tura atma işleminin sonucu iki ikili rakamla tanımlanabilir; her madeni para için bir ikili rakam kullanılabilir. Dolayısıyla bu durumda da bu şekilde (yazı tura atarak) oluşturulan bir mesajı iletmek için kullanılabilecek ikili hane sayısı entropi değerine eşittir.
n karakter varsa ve bunların her birinin olma olasılığı eşitse, bu olasılık Hn'ye eşit olacaktır. ve Y işaretinin altında her biri 1/n Log 1/7r'ye eşit olan n terim olacaktır . Yani bu durumda entropi
I=- Iog- karakter başına bit.
Hilesiz bir zar atarken, 1'den 6'ya kadar herhangi bir sayının gelme olasılığı eşittir.Bu nedenle, bu şekilde elde edilen sayı dizisinin entropisi -Iog 1 Z 6 ,' veya atış başına 2,58 bit olmalıdır.
Daha genel olarak, R basamaklı ikili sayılardan birinin seçildiğini ve her sayının seçiminin eşit derecede olası olduğunu varsayalım. toplamda 2 tane var bu tür sayılar yani
Tablodan. 10 bunu görmek kolaydır
Iog -i- \u003d Log 2 -iv \u003d - L t .
Böylece, TV basamaklı ikili sayılardan birini eşit olasılıkla seçen bir kaynağın entropisi N'dir . sayı başına bit Bu durumda, kaynak tarafından üretilen mesajın kendisi bir ikili sayıdır ve elbette ikili rakamlar kullanılarak görüntülenebilir. Ve yine, bir mesajın görüntülenebileceği ikili basamak sayısı, bit cinsinden entropiye eşittir. Bu örnek, entropi ifadesinde yer alan en uygun matematiksel fonksiyonun neden tam olarak logaritma olması gerektiğini açıkça göstermektedir.
Genel bir kural olarak, bir kaynağın belirli bir sembolü üretme olasılığı sembolden sembole değişir. Örneğin, İngilizce düzyazıya özgü olasılıklara sahip İngilizce sözcükler üreten bir ileti kaynağını ele alalım ve her sözcüğün oluşumunun önceki sözcüklerden tamamen bağımsız olduğunu varsayalım. Bu, Bölüm 3'te tartışılan birinci dereceden sözcük düzeyinde yaklaşıma karşılık gelir .
Ampirik olarak, İngilizce nesirde şu kalıbın gözlendiği bulundu: kelimeleri kullanım sıklıklarına göre sıralarsak ve olasılığı en yüksek olan en yaygın kelimeyi belirlersek (İngilizcede böyle bir kelime) kelimedir the), sayı ile 1 , aşağıdaki en olası kelime (0f) - sayı 2 , vb. vb., o zaman i'inci kelimenin oluşma olasılığı ( i'nin çok büyük olmaması şartıyla) formülle oldukça doğru bir şekilde hesaplanabilir.
Eşitlik (5.2) kesinlikle karşılanırsa, Şekil 1'deki noktalar. Kelimelerin oluşma olasılığının r'ye ( seri numarası veya kelime sıralaması) nasıl bağlı olduğunu gösteren Şekil 5.2 , grafiğin sol üst köşesinden sağ alt köşesine çizilen düz bir çizgi üzerine düşecektir. Bunun hemen hemen böyle olduğunu görüyoruz. Bir kelimenin meydana gelme olasılığı ile sıralaması arasındaki bu ters ilişki, Zieph yasası olarak bilinir. Daha
Resim. 5.2.
Zif yasasını 12. bölümde ayrıntılı olarak ele alacağız , ancak burada onu kanıtlamadan kullanacağız.
İfade (5.2) tüm kelimeler için doğru olamaz. Bunun neden böyle olduğunu anlamak için tekrar yazı tura atalım. Yazı gelme olasılığı 1/2 ve yazı gelme olasılığı da 1/2 ise , o zaman kura başka bir sonuç vermeyecektir: 1/2 + 1/2 = 1 • Şuna eşit bazı ek olasılıklar olsaydı : 1 / 10 , madeni paranın kenarına düşeceğini, o zaman her yüz atıştan AMA sonuçları bekleyebileceğimiz sonucuna varmamız gerekir: kartal - 50 ־ kez, yazı - 50 kez ve kenar - 10 kez. Ama bu açıkça saçma. Sonuçta, tüm sonuçların olasılıklarının toplamı bir olmalıdır. Şimdi, P 8727'ye kadar formül (5.2) ile hesaplanan p!, p 2 , vb. (ardışık olasılıkların toplamı) bire eşittir. Bu sonucu kelimenin tam anlamıyla alırsak, o zaman başka hiçbir kelimenin olamayacağı sonucuna varabiliriz. Ancak bu doğru değildir ve sonuç olarak formül (5.2) kesinlikle kesin değildir.
Bununla birlikte, hata küçüktür ve Shannon, İngilizce metindeki ile aynı olasılıklara sahip, birbirinden bağımsız sözcükler oluşturan bir mesaj kaynağının entropisini hesaplamak için (5.2) ifadesini kullanmıştır. Tüm kelimelerin oluşma olasılıklarının toplamının bire eşit olması için, yalnızca en yaygın 8727 kelimeyi aldı ve bu durumda entropinin kelime başına 11.8 bit olduğunu buldu.
Bölüm 4'te İngilizce metnin harf başına ortalama 5 ikili karakter veya kelime başına 27.5 ikili karakter kullanılarak yazılabileceğini gördük . Orada ayrıca 16.357 kelimenin her birine ve 27 alfabetik karakterin (boşluk dahil) her birine belirli bir ikili karakter dizisi atayarak, bir İngilizce metni kelime başına ortalama yaklaşık 14 ikili karakter kullanarak kodlamanın mümkün olacağı gösterildi . . Şimdi, entropinin gerekli minimum ikili karakter sayısını sağladığından şüphelenmeye başlıyoruz ve Shannon'a göre, İngilizce kelimelerin ortaya çıkma olasılıklarının oranı dikkate alındığında, kelime başına 11.8 ikili karaktere eşittir.
Mesajları kodlamak için gereken minimum ikili karakter sayısı sorusunu keşfetmenin bir sonraki adımı olarak, Shannon'ın doğasında meydana gelme olasılıklarıyla bir harf veya kelime dizisini bağımsız olarak seçen ergodik bir kaynak tarafından üretilen "mesajlar" hakkındaki şaşırtıcı teoremini düşünün.
Oldukça fazla sayıda karakterden oluşan, kaynak tarafından oluşturulan tüm mesajları göz önünde bulundurun. Örnek olarak, 100.000 karakterden (harfler, kelimeler veya işaretler) oluşan mesajları alabiliriz , ancak genel olarak mesajların M içerdiğini varsayacağız. karakterler. Bu raporlardan bazıları diğerlerinden daha olasıdır. En olası mesajlarda, ilk karakter yaklaşık olarak Mp i'de geçer. bir kez, ikinci - Mp 2 kez vb.Böylece, bu mesajlardaki her karakter, verilen kaynağın frekans özelliğinde görünecektir. Kaynak aynı zamanda başka türden mesajlar da oluşturabilir , örneğin, aynı sembolün sonsuza kadar tekrarlandığı mesajlar veya sadece farklı sembollerin sayısının Mp değerinden belirgin şekilde farklı olduğu mesajlar . ama onları çok nadiren yaratır.
Dikkat çekici olan şu ki, eğer H kaynağın sembol başına bit cinsinden entropisi ise, o zaman en olası mesajların sayısı 2 MN'ye eşit olacaktır ve diğer tüm mesajların ortaya çıkma olasılığı yok denecek kadar küçük olacaktır. Başka bir deyişle, mesajları azalan olasılık sırasına göre düzenlersek ve en olası 2 MN mesajın her birine ML değerli bir ikili sayı atarsak , o zaman M'den oluşan her mesaj karakterler, neredeyse kesinlikle bir sayıyla eşleşecektir.
Bu durumu basit örneklerle açıklayalım. Kaynağın 1 veya 0 karakterleri ürettiğini varsayalım . Her karakterin oluşma olasılığı 1 / 2 ise , daha önce gördüğümüz gibi, entropi H sembol başına 1 bite eşittir . Kaynak tarafından oluşturulan her mesajın M içermesine izin verin işaretler. Kesinlik için M = 1000 alırız. O zaman MH = 1000 ve Shannon teoremine göre birbirinden farklı en olası mesajların sayısı 2 1000'e eşit olmalıdır .
Ancak 1000 ikili basamakla 2 1 °00 farklı ikili sayı yazabilirsiniz . Bu nedenle, en olası mesajların her birine bir ikili sayı atamak ve farklı mesajların farklı sayılara karşılık gelmesi için 1000 basamaklı ikili sayıların alınması gerekir . Bu tam olarak almayı beklediğimiz şeydi. Kaynağın 1000 basamaklı ikili sayılardan hangisini oluşturduğunu alıcı tarafın belirleyebilmesi için 1000 ikili karakterden oluşan bir mesaj göndermek gerekir.
mesajın rakamlarının 1'in tura ve 0'ın yazı olduğu bir yazı tura atmanın sonucu olduğunu varsayalım ve tura gelme olasılığı 3/4 ve tura gelme olasılığı 1/4 olsun . Kural olarak, böyle bir mesaj tarafından alınan mesaj, sıfırlardan daha fazlasını içerecektir, ancak hepsi bu kadar değildir. Bu durumda entropinin atış başına yalnızca 0,811 bit olduğunu görüyoruz . eğer M (mesajdaki ikili karakterlerin sayısı), daha önce olduğu gibi, 1000'e eşit olacak şekilde, ardından MH ürünü artık 1000 değil, 811 olacak. Dolayısıyla , daha önce olduğu gibi, olası mesajların sayısı 21000 olmasına rağmen , en olası mesajların sayısı yalnızca 2811'dir .
811 ikili basamak kullanarak , 2.811 farklı ikili sayı ve 1000 basamaktan oluşan en olası mesajların her birini bu 2.811 ikili sayıdan herhangi biriyle eşleştirmek için yazabilir ve geriye numarasız mesajlar bırakabilirsiniz ki bunların oluşması pek olası değildir. Böylece böyle bir kaynak tarafından oluşturulan ve 1000 karakterden oluşan en olası mesaj sadece 811 ikili karakter kullanılarak alıcı uca iletilebilir . Kaynağın herhangi bir numaraya atanmamış 1000 karakterlik hayal bile edilemeyecek bir mesaj oluşturma olasılığı yok denecek kadar azdır ve göz ardı edilebilir. Doğru, bu iletim yöntemi zayıf değildir. Kaynak, zaman zaman 2.811 ikili numaramızın tümü arasında eşdeğeri olmayan mesajlar oluşturabilir . Bu durumda mesaj iletilemez - en azından 811 ikili karakter kullanılarak.
Burada yine, bir mesajı iletmek için gereken ikili karakter sayısının, karakter başına bit cinsinden entropi çarpı karakter sayısına tam olarak eşit olduğunun açık bir göstergesini görüyoruz. Ayrıca, son örnekte, iletim sırasında rakam ekonomisinin blok kodlama kullanılarak elde edildiğine dikkat edilmelidir, yani mesaj kaynağı tarafından üretilen 1000 ( veya yeterince büyük başka bir sayı) karakterin bir sayı olarak kabul edildiği böyle bir kodlama. tek bir bütün ve en olası karakter kombinasyonlarının her biri, kendi bireysel koduyla ( 811 ikili karakterden oluşan) görüntülenir .
Bu varsayımı daha kesin ve genel bir şekilde nasıl kanıtlayabiliriz?
Şimdiye kadar, hangi karakterlerin kullanıldığına bakılmaksızın, yalnızca mesaj kaynağının her bir karakteri (sayı, harf, kelime) oluşturduğu durumları ele aldık.
önce oluşturuldu. Bildiğiniz gibi, bu İngilizce dili için geçerli değil. Bir dilde sözcüklerin seçimi, yalnızca geçiş sıklıklarıyla değil, aynı zamanda belirli bir düzenleme sırasına uyma ihtiyacıyla da sınırlıdır. Bu nedenle, bir sonraki kelimeyi seçme şansı, her kelimenin seçiminin bir öncekinden bağımsız olarak yapılmasına göre daha azdır.
Bu durumda nasıl olunur? Bu sorunu çözmenin anahtarı , Bölüm 4'te bahsettiğimiz ve son örnekte* önceki harflerin sayısını tekrar ele aldığımız , ancak daha önceki harflerden bile bahsetmediğimiz blok kodlamadır. Bölüm 3'teki ikinci ve üçüncü düzey İngilizceye yaklaşım, böyle bir işlemle üretilen bir metin örneği sağlar. Ayrıca, matematiksel anlamı olan herhangi bir gerçek ergodik süreçte, bir önceki sembolün bir sonraki üzerindeki etkisi, bu sembolden uzaklaştıkça azalmalıdır. Bu kalıp İngilizce'de de görülmektedir. Bunun böyle olmadığı örnekleri düşünebilseniz de (diyelim ki romanın kahramanının adı hikaye boyunca değişmez), ancak kural olarak, bundan sonra yazacağım kelime hiçbir şekilde hangi kelimeye bağlı değildir. Bundan önce 10.000 kelime yazdım .
Şimdi mesajın kodlamadan önce çok uzun karakter bloklarına bölündüğünü varsayalım. Bloklar yeterince uzunsa, yalnızca bloğun en başındaki semboller bir önceki bloğun sembollerine bağlı olacaktır ve eğer bloklar uzarsa, önemli ölçüde öncekinin sembollerine bağlı olan bu semboller blok, bloğun tüm sembollerinin ihmal edilebilecek kadar küçük bir bölümünü oluşturacaktır. Bu, ifade (5.1) kullanılarak blok başına entropinin hesaplanmasına izin verir . İfadenin (5.1) doğrudan kullanımı için, i'inci blok olarak adlandıracağımız çok sayıda sembol bloğundan birinin P (B i ) aracılığıyla olma olasılığını belirtiriz. O zaman blok başına entropi şuna eşit olacaktır:
ben = - Y P (B ben ) Günlük P (B ben ) blok başına bit, g
Hiçbir matematikçi bu ifadeye entropi demeye cesaret edemez. I'in değerinin yarı- 110 olduğunu söylerdi.
Yukarıdaki ifade tarafından verilen, bloklar uzadıkça, yani bloklara daha fazla karakter girdikçe entropiye yaklaşır . Blokların çok uzun olduğunu varsayarsak, gerçek entropiye çok iyi bir yaklaşım elde ederiz. Bu uyarıyla , bloğun entropisini N bloğundaki karakter sayısına bölerek karakter başına entropiyi de elde edebilirsiniz:
jf = - ζ-0 $ sembol başına • (5-3)
G
Genel olarak konuşursak, semboller arasındaki bağımlılığı dikkate almazsak, formül (5.3) ile hesaplanan entropi değeri her zaman biraz fazla tahmin edilir. Böylece, eğer N (bloktaki karakter sayısı) H'den daha fazlasını yapar azalacak ve entropinin gerçek değerine yaklaşacaktır.
Başından beri stresliyiz bilgi miktarının ölçüsü, birkaç telgraf teli üzerinden birkaç farklı mesajın iletimindeki toplam bilgi miktarı, tek tek teller üzerinden iletilen bilgi miktarlarının toplamına eşit olacak şekilde seçilmelidir. Bu nedenle, aynı anda çalışan birkaç mesaj kaynağının entropisini hesaplamak için, tek tek kaynakların entropilerini toplamak gerekir. Daha da ileri gidilebilir ve kaynak aralıklı olarak çalışıyorsa, o zaman ortalama bilgi oluşturma oranını hesaplamak için, bu oranı, yani entropiyi, kaynağın çalıştığı süre ile çarpmak gerekir.
Dönüşümlü olarak bağlanan bir dizi mesaj kaynağı olmasına izin verin ve her kaynağın bağlantısının, dahil edilmeden hemen önce hangi harf dizisinin oluşturulduğuna göre belirlenmesine izin verin. Örneğin, bu kaynaklardan biri, bir TH dizisi oluşturulursa açılır . Bu durumda, bu kaynağın üreteceği bir sonraki harfin E olması çok muhtemeldir . NQ dizisi oluşturulmuşsa başka bir kaynak açılacaktır . Bu durumda, bir sonraki karakterin U olma olasılığı bire eşittir. Bu mesaj kaynaklarının her birinin entropisini hesaplayalım. Sonra kaynağın entropisini 2 ile çarparız ? f , olasılık üzerine
: hasta
p(Bi) döngüde olan şey . Bu kaynağı ymeiyo (yani, bu kaynağa atıfta bulunan toplam inklüzyon sayısının o kısmıyla çarpın). Sonra, kalan kaynakların her birinin entropisini, bu belirli kaynağın açılma olasılığıyla çarparız, vb. - her biri zamanın yalnızca bir kısmında çalışan birçok farklı kaynağın ikili birleşimi. Örnek olarak, semboller oluştururken yalnızca digramların ortaya çıkma olasılığını hesaba katan kaynakları düşünün, böylece geçmişin tüm etkisi en son oluşturulan harfte yoğunlaşır. Son harf JE ise kaynaklardan biri açılacaktır ; bu kaynak , toplam dahil etme sayısının 0,13 kısmını çalıştıracaktır . Son harf W ise başka bir kaynak açılacaktır ; toplam çalıştırma sayısının 0,02'si çalışacaktır .
Matematik dilinde, bu şu şekilde formüle edilebilir: B i1 sembol bloğundan sonra olma olasılığı N içeren karakterler, *S f j ∙ karakteri oluşturulacak, eşittir
P girişi (Sj)*
B i1 bloğu oluşturulduğunda etki eden bu "kaynağın" entropisi N içeren karakterler eşittir
-%p b .(Sj)10sp b .(Sj).
j ben ben
Ancak, toplam dahil edilme sayısının hangi kısmı, belirli bir kaynağın dahil edilme sayısıdır? Bu kısım, B i1 bloğunun ortaya çıkma olasılığıdır. ve başka bir blok değil; bu kısmı arayalım
P(Bı ) .
Böylece, N içeren tüm bloklar verildiğinde semboller, tüm bireysel kaynakların entropilerinin toplamını yazıyoruz (her bir kaynağın dahil edilmesi, B i1 bloklarından hangisi tarafından belirlenir? N içeren karakterler, Sj karakterinin seçiminden önce gelir ) gibi
H n =- SP ( β *> Pε ben ( s ben) 1 °S Pε ben ( s ben)∙ (5.4)
ben 1 Ben
Toplama işaretinin altına yazılan r, y alt simgeleri, ii/ yerine alabilecekleri tüm değerleri değiştirmeniz ve ardından bu durumda elde edilen tüm sayıları eklemeniz gerektiği anlamına gelir.
N olarak (Sj karakterinden önceki karakter sayısı ) çok büyük olur, H n kaynağın entropisine yaklaşacaktır. N'den daha fazla olan karakterler arasında istatistiksel bir ilişki yoksa semboller (bu, N = 1 olan digramların kaynağı ve N = 2 olan trigramların kaynağı için geçerlidir), sonra H n ve entropi vardır.
Shannon (5.4) ifadesini biraz farklı yazdı. p (B i1 Sj) olduğundan — blok B i'nin oluşma olasılığı ve ondan sonra Sj sembolü р (B ben ) - B ben bloğunun oluşma olasılığına eşittir , pβ i (Sj) ile çarpılan Sj sembolünün oluşma olasılığıdır blok B i'den sonra , o zaman ifade (5.4) aşağıdaki gibi yazılabilir:
H n = — Σ P (B t , S ben ) Iog р В ' (Sj ) .
Bölüm 3'te , sonlu sayıda duruma sahip bir makineyi metin kaynağı olarak ele aldık ve bunlardan biri Şekil 1'de tasvir edildi. 3.3. İstenirse, muhakememizdeki benzer bir makine kullanılarak entropi formülü türetilebilir. İçin. Bu nedenle, makinenin her durumunu bir mesaj kaynağı olarak kabul ediyor ve bu durumun entropisini hesaplıyoruz. Daha sonra, her bir durumun entropisini makinenin bu özel durumda olma olasılığıyla çarparak ve tüm durumları toplayarak gerekli entropiyi elde ederiz.
Tüm bunları matematiksel sembollerle yazmak için, makine r durumundayken, / ile göstereceğimiz belirli bir sembolü üretme olasılığının p i olduğunu varsayalım. (/). Örneğin, i değeri ile karakterize edilen bir durumda = 10, bir sonraki harfin alfabenin üçüncü harfi olma olasılığı 0,03'tür ; bu harfi j = 3 olarak gösteriyoruz.
Pio (3) = 0.03.
Entropi H ben i durumu formül (5.1) ile hesaplanır
#i = - ∑Pi (7) IogPi (7)∙
J
113
8 J. Pierce Şimdi P i'ye izin verin i'nci durumda bir araba bulma olasılığıdır. Ardından, bir mesaj kaynağı olarak makine için sembol başına entropi şu şekildedir:
H = 2 P ben H ben karakter başına bit
Bunu şu şekilde yazabiliriz
I = - 2 PiPi (7) 1 ° β Pi (7) sembol başına bit, (5.5) burada Pi sonlu sayıda duruma sahip makinenin i'nci durumda olma olasılığıdır ve p i (/), makinenin i. durumdayken i. karakteri üretme olasılığıdır. 2 işaretinin altında yazılan i ve / indeksleri öncekiyle aynı anlama sahiptir.
Böylece birbirinden bağımsız semboller oluşturacak ve (5.1) ifadesinin geçerli olduğu bir kaynağın entropisinden, basit ve doğal bir şekilde daha zor bir duruma, sembollerin oluşma olasılıklarının bağlı olduğu duruma geçmiş olduk. Bundan önce hangi semboller yaratıldı. . Ve bir mesaj kaynağının entropisini hesaplamak veya belirlemek için üç farklı formülümüz var. Kaynağın ergodisite koşulunu tam olarak sağlaması koşuluyla, hepsi kesinlikle doğrudur ve birbirine eşdeğerdir. Ancak, İngilizce metnin ancak yaklaşık olarak ergodik bir kaynak olarak kabul edilebileceği unutulmamalıdır.
Böylece, sembol başına entropi için genel bir ifade bulduk. Şimdiki zorluk, karakter başına entropi ile bir mesajı aynı kesin şekilde kodlamak için gereken karakter başına ortalama ikili karakter sayısı arasındaki ilişkiyi kurmaktır.
Mesaj, harflerden veya kelimelerden oluşan ayrı bloklara bölünürse ve alınan her blok belirli bir karakter olarak kabul edilirse, o zaman entropiyi hesaplarken kullandığımız formülü kullanarak blok başına entropiyi hesaplayabileceğimizi zaten gördük. blok başına. - asılı sembol. Ayrıca, mesaj yeterince uzun bloklara bölünürse, kaynağın entropi değeri herhangi bir doğrulukla hesaplanabilir.
Bu nedenle, problemimiz şu şekilde formüle edilebilir: ikili karakterler kullanarak bir karakter dizisini verimli bir şekilde kodlamanın bir yolunu bulmak.
Tablo 11
çok sayıda sembol olması ve her sembolün iyi tanımlanmış, sıfır olmayan bir seçilme olasılığına sahip olması şartıyla. Shannon ve Fano bunun nasıl yapılacağını gösterdi. Bu sorunu çözmek için benzer ama biraz daha iyi bir yöntem Huffman tarafından bulundu. Şimdi bu yöntemi ele alacağız.
Kolaylık sağlamak için, tüm sembolleri azalan olasılık sırasına göre alt alta yazıyoruz. Sekiz kelimenin sembol olarak kullanıldığını varsayalım: the (belirsiz makale), tap (person), to (edat), run (koşar), house (house), likes (beğeni), horse ( at ), sells (satılmış). Bu sembollerin birbirinden bağımsız olarak ortaya çıkma veya seçilme olasılıkları Tablo'da verilmiştir. on bir.
(5.1) kullanılarak hesaplanabilir ; kelime başına 2,21 bit'e eşittir . Bununla birlikte, her kelimeye 3 basamaklı ikili sayılardan birini atasaydık, her kelimeyi temsil etmek için üç rakama ihtiyacımız olurdu. Bu kelimeleri daha verimli bir şekilde nasıl kodlayabilirim?
Resimde. Şekil 5.3, böyle bir mesajın kelime kelime iletilmesi için en verimli kodun nasıl oluşturulacağını göstermektedir . Kelimeler solda yazılır ve olasılıklar parantez içinde verilir. En düşük olasılığa sahip iki kelimeyi - 0,02 (satıyor) ve 0,03 (at) - bularak kodu oluşturmaya başlayalım ve at kelimesinin veya sel y ls kelimesinin olasılığı olan 0,05 ile işaretlenmiş noktaya çizgiler çizelim . O zaman bu kelimelerin ortaya çıkma olasılıklarını ayrı ayrı hesaba katmayacağız ve yine en küçük iki olasılığı bulacağız: 0.04 (beğeni) ve 0.04 (ev). 0.08 ile işaretlenmiş noktaya ( 0.04 ve 0.04'ün toplamı ) sağa doğru bir çizgi çiziyoruz. Şimdi en düşük iki olasılık 0,05 ve 0,08, bu yüzden onlardan çizgiler çekiyoruz,
THE (0,50)
MAN (0,15)
ТО (0,12)
RUNS (0,10)
HOUSE (0,04)
LIKES (0,04)
HORSE (0,03)
SELLS (0,02)
bu bize 0.13 etiketli bir nokta verecektir . Her kelimeden gelen satırlar sağda 1.00 etiketli ortak bir noktada birleşene kadar bu işleme devam ediyoruz. Her noktadan iki çizgi sola doğru uzanır: biri yukarı, diğeri aşağı. Üst satır 1 sayısıyla, alt satır - 0 sayısıyla gösterilecektir. O zaman bu kelimenin kodu, ortak nokta 1.00'den bu kelimeye giden yolda karşılaşacağımız sayı dizisi olacaktır . Ortaya çıkan kodlar tabloda verilmiştir. 12.
Tablo 12
116 •
Masada. 12, kelimeler ve kodlarının yanı sıra, her bir kodun oluşma olasılıkları ve her bir koddaki karakter sayısı da yazılır. Her koddaki karakter sayısıyla çarpılan bir kelimenin görünme olasılığı, uzun bir mesajda belirli bir kelime başına ortalama karakter sayısını verir. Olasılıkların ve karakter sayısının çarpımını toplarsak, kelime başına ortalama karakter sayısının 2,26 olduğunu buluruz. Bu değer, kelime başına 2.21 bit olarak bilinen kelime başına entropiden biraz daha büyüktür , ancak her kelimeye kişisel 3 haneli bir kod atarsak kullanmak zorunda kalacağımız kelime başına üç haneden daha azdır.
Huffman kodunun yalnızca farklı olasılıklara sahip bir karakter dizisini kodlamak için en verimli kod olmadığı, aynı zamanda bu kodlama yöntemiyle gerekli ikili karakter sayısının asla birden fazla entropi değerini (in Yukarıdaki örnekte yalnızca 0 gereklidir , karakter başına 05 ek ikili işaret).
kodlamadan önce karakterlerin 1, 2, 3 veya daha fazla karakterden oluşan bloklar halinde birleştirildiğini varsayalım . Her bloğun oluşma olasılığı sıfırdan farklıdır (semboller birbirinden bağımsız olarak seçilirse, belirli bir sembol dizisinin oluşma olasılığı, tek tek sembollerin olma olasılıklarının çarpımına eşit olacaktır). Bu karakter blokları için bir Huffman kodu oluşturulabilir. Bloklar uzadıkça uzadıkça, blok başına ikili karakter sayısı artar. Ve yine de, Huffman kodlamasıyla, blok başına ikili karakter sayısı, bloğun bit cinsinden entropisini birden fazla aşamaz! Böylece, bloklar ve kodları çok uzun hale geldikçe, -10 m-0'dan daha az Huffman kodunun fazladan rakamı, toplam karakter sayısının ihmal edilebilir bir parçası haline gelir ve bloklar uzadıkça, blok başına ikili karakter sayısı şu hale gelir: artan doğrulukla, bit cinsinden entropiyi bloke edin.
C'yi iletmenin mümkün olduğunu varsayalım. açık - kapalı tipi darbeler. İle
böyle bir kanal gönderilebilir C saniyede ikili karakter. Her ikili karakter 1 bit bilgi taşıyabilir . Bu nedenle, bu kanalın bilgi iletme yeteneğinin C'ye eşit olduğunu söyleyebiliriz. * Saniye başına bit. Saniyedeki bit cinsinden ölçülen H mesaj kaynağının entropisi C'den küçükse, kaynak sinyalleri bu kanal üzerinden iletilebilir ve bunları Huffman yöntemi kullanılarak kodlayabilir.
Ancak hiçbir kanal ikili karakterleri iletmez. Örneğin, üç farklı genliğe sahip darbelerin veya Mors alfabesinde olduğu gibi farklı sürelere sahip darbelerin iletildiği bir kanal mümkündür. Bu kanala çeşitli mesaj kaynaklarının bağlı olduğu ve her kaynağın belirli bir entropiye veya bilgi oluşturma hızına sahip olacağı düşünülebilir. Ve bazı kaynaklar bu kanaldan iletilebilecek en yüksek entropiyi verecektir. Bu mümkün olan en yüksek entropi, C harfi ile gösterilen kanal kapasitesi olarak adlandırılır. ve saniyede bit cinsinden ölçülür.
yardımıyla , kanalın çıkış sinyali, üzerinden mümkün olan en yüksek entropiye sahip bir mesaj iletildiğinde, saniye başına en küçük ikili karakter sayısı ile temsil edilebilir ve mesajın uzun bölümleri kodlanırsa uzun ikili karakter dizileri ile, o zaman saniyedeki bit sayısı, C'ye çok yakındır. Bu kodlama, elbette, ters yönde yapılabilir ve C Saniyedeki bağımsız ikili karakterlerin bu kanal üzerinden iletilebilmesi için kodlanması. Böylece, H entropili bir kaynaktan gelen mesajlar H tarafından kodlanabilir. saniyede ikili basamak ve C kapasiteli bazı ayrık kanal C göndermek için kullanılabilir Saniye başına bit.
Artık bilgi teorisinin ana teoremlerinden birini değerlendirebiliriz. Shannon buna gürültülü bir kanal için temel teorem adını verdi. Bu şekilde formüle edilmiştir:
Kaynağın entropisi H (sembol başına bit) ve kanalın kapasitesi C (bit/saniye) olsun. Daha sonra, kaynağın çıkışındaki mesajları, orta oranlı kanal (CIH) üzerinden semboller ve saniyede semboller iletecek şekilde kodlamak mümkündür ; burada
ILS
8 keyfi olarak küçüktür. CIH'den daha yüksek bir ortalama hızda iletmek mümkün değildir .
Bu teoremi matematiksel incelikler olmadan tekrar anlatalım. İkili karakterleri, rakamları, harfleri, sayıları veya darbeleri ve belirli bir süredeki duraklamaları ileten herhangi bir ayrık kanalın kendi kapasitesi C vardır. Ergodik bir kaynağın belirli bir miktarda H entropisi vardır. H ise C'den küçük veya eşitse , bu kaynak tarafından üretilen mesajlar bu kanal üzerinden iletilebilir. eğer H C'den fazlaysa , aktarım imkansızdır ve bunu yapmaya çalışmamak daha iyidir.
Yukarıda bu teoremin ilk kısmının nasıl ispatlanabileceğini göstermiştik. Doğru, entropili bir kaynaktan gelen mesajların H olduğunu kanıtlamadık. daha küçük bir H ile kodlanamaz karakter başına ikili karakter sayısı, ancak bu da kanıtlanmıştır.
Artık, bit cinsinden ölçüldüğünde, kaynağın entropisinin, iletmek için işaret, harf, kelime veya saniye başına kaç tane ikili karakterin (veya açma-kapama tipi darbeler veya evet-hayır tipi darbeler) gerektiğini belirlediğinden eminiz. kaynak tarafından oluşturulan mesajlar. Bu tür bir bağımlılık Shannon tarafından kurulmuştur. Ve mesele şu ki, bit kelimesi ikili basamak için uygun bir kısaltmadır .
Burada bit kelimesini belirli bir anlamda, bilgi miktarının bir ölçüsü olarak kullandım, diğer durumlarda ifadeyi kullandım - bir ikili işaret (veya rakam). Bunu, bit kelimesini iki farklı şeyi kastetmek için kullanmaya başlarsam kolayca doğabilecek karışıklığı önlemek için yaptım .
Uygulamada, bitlerdeki entropi genellikle kullanılan ikili basamak sayısından farklıdır. Örneğin, mesaj kaynağının rastgele olarak 1/4 olasılıkla 1 karakteri ve 3/4 olasılıkla 0 karakteri ürettiğini ve saniyede 10 karakter ürettiğini varsayalım . Tabii ki, böyle bir kaynak saniyede 10 basamak hızında ikili basamaklar oluşturur , ancak kaynağın bilgi oluşturma hızı, yani entropisi, ikili basamak başına 0,811 bit veya saniyede 8,11 bittir. Bu kaynak tarafından üretilen ikili basamak dizisini saniyede ortalama yalnızca 8.11 bit kullanarak kodlayabiliriz .
1 saniyede rastgele seçilmiş 10.000 açma-kapama darbesinin iletilebildiği bir iletişim kanalı olduğunu varsayalım . Doğal olarak, böyle bir kanalın bant genişliği saniyede 10.000 bittir. Ancak kanal değişmez bir şekilde tekrar eden bir darbe dizisini iletmek için kullanılıyorsa, o zaman gerçek bilgi aktarım hızının saniyede 0 bit olduğunu kabul etmemiz gerekecek , ancak kanal üzerinden saniyede 10.000 ikili karakter şüphesiz iletilmektedir.
Bu kitapta bit kelimesini yalnızca bilgi miktarının ikili ölçüsü anlamında, bir entropi birimi olarak kullandık, yani bilginin bir mesaj kaynağı tarafından bit cinsinden oluşturulma hızı için bir ölçü birimi olarak. karakter başına veya bit/saniye cinsinden ve ayrıca bir ölçü birimi olarak, sembol başına bit veya saniye başına bit cinsinden kanal bant genişliği. Biraz, temel bir seçim veya eşit derecede olası iki olasılıktan birinin gerçekleştirilmesi olarak düşünülebilir. Bir mesaj kaynağında, bir bit, üretilecek mesajla ilgili olarak bir seçim ölçüsünü temsil eder; İngilizce'de dilbilgisi açısından doğru yazarsanız, her harf için seçim ortalama olarak yaklaşık bir bit olacaktır. Mesajı alma noktasında, bir parça bilgi bir miktar belirsizliği giderir; İngilizce metin alırken, bir sonraki mektubun ne olacağı konusunda ortalama olarak yaklaşık bir bitlik belirsizlik vardır.
Bir bilgi kaynağı tarafından oluşturulan mesajları açma-kapama darbeleri kullanarak ileterek, (çoğu durumda olduğu gibi) kaynağın entropisi bilinmese bile, saniyede kaç bit ilettiğimizi biliyoruz. (Saniyedeki bit cinsinden kaynağın entropisinin, saniyede iletilen ikili karakter sayısından daha az olduğunu bilseydik, prensip olarak saniyede daha az ikili karakterle idare etmenin mümkün olduğunu bilirdik.) Nasıl olduğunu biliyoruz. bir veya daha fazla olasılığı temsil etmek için ikili karakterler kullanmak veya ŞEKİL 2'de gösterilen kod ağacını kullanmak. 4.4 veya Huffman kodunu kullanarak (bkz. Şekil 5.3). Bu durumda bit hızı yerine bit hızından bahsetmek adettendir ve burada kafada her şeyin karışmaması için özen gösterilmelidir.
bit kelimesini yalnızca bir anlamda - bir bilgi birimi olarak kullanacağımız ve 0 ve 1 işaretlerini ikili basamak olarak adlandıracağımızdır . Saniyede 1000 rastgele seçilmiş ikili basamak iletebilirsek , saniyede 1000 bit bilgi iletebiliriz . İkili rakam yerine bit terimini kullanmak uygun olabilir, ancak ne yaptığımızı anladığımızdan emin olmamız gerekiyor.
Şimdi Tablo 1'de gösterilen Huffman koduna dönelim. 12 ve ŞEK. 5.3. Bir mesajı bu kodla kodlayarak, sürekli bir karakter dizisi elde ederiz. Bir dizi karakterden rastgele seçilen belirli bir sembolün 1 kelimesini temsil edip etmediğini veya başka bir kelimenin kodunun bir parçası olup olmadığını nasıl anlayabiliriz ?
Tablodaki kodların hiçbirinin olmadığına dikkat edilmelidir. 12 başka bir kodun başlangıcı değil. Bu özelliğe önek özelliği denir . Kolayca kanıtlanabilecek önemli ve çok şaşırtıcı sonuçları vardır. Örneğin, bir mesajı kodladığımızı varsayalım:
ADAM EVİ ADAM'A SATIR AT ADAM'A KOŞUR .
Kodlanmış mesaj şuna benzer:
Burada mesajın sözleri kod cesetlerinin üzerine yazılmıştır.
Şimdi, yalnızca ilk dikey noktalı çizgiden sonraki sayıları kabul ettiğimizi varsayalım. Kodumuzda bir kelimenin yerini alan en kısa rakam dizisini bularak şifre çözmeye başlayalım. Bu 00010'dur ve LiKES kelimesine karşılık gelir . Aynı ruhla devam ediyoruz. "Kodu çözülmüş" kelimeler kodun altına yazılır ve noktalı çizgilerle ayrılır.
Birkaç hatadan sonra noktalı çizgilerin düz çizgilerle çakışmaya başladığını ve bu noktadan sonra mesajın şifresinin doğru bir şekilde çözüldüğünü görüyoruz. Açıkçası, bu mesajı doğru bir şekilde çözmek için (mümkün olduğunca) bu mesajı temsil eden rakam dizisinin tam olarak nerede başladığını bilmek bile gerekli değildir.
Geriye dönüp baktığımızda, bu bölümün amacına ulaştığını görürüz. Ergodik bir kaynak için sembol başına veya zaman birimi başına bilgi miktarının bir ölçü birimini elde ettik ve entropinin, kaynak tarafından üretilen mesajları iletmek için gereken sembol başına ortalama ikili basamak sayısına eşit olduğunu gösterdik. . Ayrıca, entropi değerini biraz aşan en küçük ikili basamak sayısıyla iletmek için, her karakteri ayrı ayrı değil, yeterince uzun mesaj bloklarını kodlamanın gerekli olduğunu da not ettik.
Ancak şu soru ortaya çıkıyor: bloklar ne kadar uzun olmalı? Burada tartışmaya devam etmeliyiz. Blok kodlama iki nedenden dolayı arzu edilir. İlk olarak, Huffman kodunda kullanılan karakter başına ortalama ikili basamak sayısı, karakter başına entropiden biraz daha büyük olmalıdır. İkinci olarak, İngilizce metin gibi materyalleri verimli bir şekilde kodlamak için, belirli bir karakterin ortaya çıkma olasılığı üzerindeki önceki karakterlerin etkisini hesaba katmanız gerekir. Bunun formül (5.3) kullanılarak ve çok uzun bloklar alınarak yapılabileceğini gördük .
Bu yüzden sorumuza dönüyoruz: kaç karakter N bir blok içermelidir ki 1) Huffman kodu yeterince verimli olsun ve 2) blok boyunca ilişkileri ihmal edersek blok başına entropi yeterli olsun
N i bloğundaki karakter sayısına yakındır sembol başına entropi ile çarpılır mı? İngilizce metin söz konusu olduğunda, ikinci koşul belirleyicidir.
1, 2, Zit gösterildikten sonra bir mesajın bir sonraki harfini tahmin etme becerilerini ölçerek İngilizce bir metnin harfi başına entropiyi kabaca hesapladı . e. önceki harfler. Bu metinlerde "alfabe" 26 harf artı bir boşluktan oluşuyordu.
Resimde. Şekil 5.4, İngilizce metnin entropisine üst ve alt sınırların, konunun tahminlerde bulunurken gördüğü harf sayısına bağımlılığını göstermektedir. Harf sayısı 10'dan 15'e çıktıkça eğrinin eğimi çok hafif olmakta ve 15 ile 100 harf arasında oldukça belirgin bir düşüş olmaktadır. Görünüşe göre bu, İngilizce metnin yeterince verimli bir şekilde kodlanması için en az 100 harf içeren blokların alınması gerektiğini gösteriyor.
ŞEK. Şekil 5.4'ten , İngilizce metnin entropisinin harf başına 0,6 ile 1,3 bit arasında olduğu açıktır. Bunu harf başına 1 bit olarak kabul edeceğiz . Ardından, 100 harf içeren bir bloğu kodlamak için ortalama 100 ikili karakter gerekecektir. Bu, İngiliz alfabesinin 100 harfinden oluşan 2.100 en olası kombinasyon olduğu anlamına gelir . Normal ondalık gösterimde 2.100, 1 ve ardından 30 sıfır olarak yazılabilir . Fevkalade büyük sayı!
İngilizce bir metinde herhangi bir anlam ifade eden her 100 harflik bloğun olasılığını bulmaya çalışırsak, bu tür her bloğun göreceli oluşma sıklığını hesaplamamız gerekir. Ve en olası bloklardan IO 30 olduğu için bu neredeyse imkansızdır.
Üstelik prensipte bile imkansız. Bunların çoğu IO 30 harf dizileri ( IO 30 sayısında olduğu gerçeğinden bahsetmiyorum bile) dizileri hiçbir anlam ifade etmeyen tüm dizileri içermez ) asla yazılmadı! Bu nedenle, İngilizce metinden bu tür uzun harf bloklarının nispi görülme sıklığını veya olma olasılığını elde etmek söz konusu değildir.
Burada iki soruyla karşı karşıyayız.
İngilizce bir metnin ergodik bir kaynağın ürünü olduğu fikri ne kadar doğrudur?
Resim. 5.4.
Bu kaynağın hangi istatistiksel açıklama yöntemi en uygun olarak kabul edilebilir? ' >
Kaynağın istatistiksel bir açıklamasına uygun bazı olasılıkların, mevcut metin incelenerek hesaplanamasa bile, bir şekilde bir kişide gerçekten var olması oldukça olasıdır. Ayrıca, bu olasılıkların nesnel olarak var olduğu ve harf dizilerinin oluşma olasılıklarının safça hesaplanmasıyla değil, başka, daha incelikli bir şekilde elde edilebileceği varsayılabilir. Örneğin, bir ergodik kaynağın entropisinin hem formül (5.4) hem de formül (5.5) kullanılarak hesaplanabileceğine dikkat edin . formül (5.5), sonlu sayıda duruma sahip bir makineye uygulanabilir. 3. Bölümün sonunda , belirli bir durumda olan bir kişinin iyi tanımlanmış bir sembol veya kelime yarattığını düşünmenin çok cazip olduğunu zaten söylemiştik.
Bununla birlikte, bazı dilbilimciler, İngilizce dilbilgisi ile sonlu durum makinesi üretiminin uyumsuz olduğu görüşündedir. Gerçek bir İngilizce metnin yapısını anlamak ve entropisini anlamak için, bu metni şimdiye kadar yapılanlardan daha derinlemesine incelemek açıkça gereklidir.
Nasıl yapılacağını biliyorsanız, titiz bir matematiksel teoriyi, teorinin doğru olduğu ideal bir soyutlamaya körü körüne, mekanik olarak uygulamak oldukça güvenlidir. Ancak iyi ve başarılı bir matematiksel teoriyi bile pratik, ideal olmaktan uzak problemleri çözmek için kullanmak için akıllıca davranılmalıdır. İngilizce metni bilgi teorisiyle mümkün olduğunca iyi ve doğru bir şekilde ilişkilendirmek için, İngilizce dilinin basit ve gerçeğe yakın düzenlilikleri aranmalıdır. Bu durumda elbette dilbilgisi önemli bir yer tutmalı ve bir sonraki bölümü ona ayıracağız.
İngilizce metinde her zaman bazı harflerin veya kelimelerin sürekli tekrarlanma sıklığı gibi bazı istatistiksel kalıplar olduğunu biliyoruz ve kodlama teoremleri bu kalıplardan yararlanmamızı sağlıyor.
İngilizce metni harf harf kodlarsak ve bu harflerin göreli oluşum sıklığını göz ardı edersek, karakter başına (boşluk dahil) 4.76 ikili karaktere ihtiyacımız olur. Harf ile kodlarsanız, ancak verilirse
farklı harflerin göreli olasılıkları için, karakter başına 4.03 ikili karaktere ihtiyacımız var. Kelimelere göre kodlarsak ve tek tek kelimelerin göreceli oluşum sıklığını hesaba katarsak, karakter başına 2.14 ikili karaktere ihtiyacımız var. Akıllıca akılcı yöntemler kullanan Shannon, bir İngilizce metnin entropisinin harf başına 0,6 ile 1,3 bit arasında olduğunu gösterdi. Bu nedenle, daha verimli kodlamaya güvenilebilir.
Bununla birlikte, bir İngilizce metnin entropisini bulmak için bir yöntemin tüm durumlarda mekanik olarak uygulanması, yalnızca zorluklara değil, aynı zamanda saçmalıklara da kolayca yol açabilir. Bunun kısmen İngilizce metnin insan kaynağı ile ideal bir ergodik kaynak modelimiz arasındaki farka atfedilmesi mümkündür, ancak bir dereceye kadar aynı zamanda tamamen uygun olmayan bir yöntemin kullanımına da atfedilmelidir. Metnin bir insan modeli olarak ergodik kaynağı mükemmel olmasa da, yine de bu modelin oldukça iyi ve kullanışlı olduğu ve bu nitelikleri nedeniyle çok takdir edilmesi gerektiği güvenle söylenebilir.
Bu bölümün uzun ve zor olduğu ortaya çıktı ve görünüşe göre burada kısa sonuçlar çıkarmak gerekiyor. Ama bu kadar sayfa süren her şeyi çok kısa tekrarlamak elbette ki imkansız. Bu nedenle, yalnızca en önemli hükümleri vurgulamamız gerekecek.
Bilgi teorisinde, bir sinyal kaynağının sembol başına bit veya saniye başına bit cinsinden entropisi, kaynak tarafından üretilen mesajı kodlamak için gereken sembol başına ortalama bit sayısını veya saniye başına ortalama bit sayısını verir.
Mesajların kaynağı ile, birçok olası mesajdan birinin iletimi için rastgele, yani öngörülemeyen bir seçimi kastediyoruz. Bu nedenle, mesajların kaynağı ile ilgili olarak, entropiyi bir seçim ölçüsü, herhangi bir belirli mesajı seçerken kaynağın yaptığı seçimlerin sayısı olarak kabul ediyoruz.
Muhatap, mesajı almadan önce, kaynak tarafından birçok olası mesajdan hangisinin oluşturulacağı ve iletileceği konusunda bir belirsizlik yaşadığına inanıyoruz. Bu nedenle, mesajların kaynağının entropisinin, alıcının hangi mesajın alınacağına ilişkin belirsizliğinin bir ölçüsü, mesajın alınmasıyla çözülen belirsizliğin bir ölçüsü olduğuna inanıyoruz.
n denkleştirilebilir sembol veya mesajdan* biriyse , o zaman entropi Iog n'dir.Bu oldukça doğaldır, çünkü eğer log n ikili karakterimiz varsa, bunları yazmak için kullanabiliriz.
2 10gn = n
n mesajın her biri için bir kod olarak kullanılabilir .
(5.1) kullanılarak hesaplanabilir . Daha önce hangi sembolün seçildiğine pek bağlı olmayan çok uzun sembol bloklarını bir tür süper sembol olarak düşünürsek, formül ( 5.1) , sonraki seçimin yapıldığı bu tür kaynaklar için sembol başına entropiyi hesaplamak üzere dönüştürülebilir. sembol bir öncekinden farklıdır. Bu bizi formül (5.3)'e getirir. Entropi için diğer genel ifadeler formül (5.4) ve (5.5) ile verilmiştir .
Kaynak tarafından üretilen sembollerin veya sembol bloklarının en verimli şekilde (Huffman yöntemi) kodlandığı varsayılarak, bit cinsinden ölçülen ergodik kaynağın entropisinin ortalama ikili karakter sayısına eşit olduğu kanıtlanabilir. kodlama için gereklidir.
Hatasız bir iletişim kanalı, yalnızca ikili sayıları değil, aynı zamanda harfleri veya diğer sembolleri de iletebilir. Çeşitli mesaj kaynaklarının böyle bir kanala bağlı olduğu ve mesajları* bu kanaldan hatasız iletildiğinde maksimum entropiye sahip kaynağın (genellikle matematiksel yollarla) bulunduğu düşünülebilir. Böyle bir kanal üzerinden gürültüsüz iletilen bir mesajın mümkün olan en büyük entropisine kanal kapasitesi denir . Kaynak entropisi kanal kapasitesinden küçükse, kaynak mesajlarının verilen kanal üzerinden iletilebilmesi için kodlanabileceğini kanıtlamak bizim elimizdedir. Bu, gürültülü bir kanal için Shannon'ın ana teoremidir.
(5.1), (5.3)–(5.5) şeklindeki ifadeler, ilke olarak, kaynak tarafından oluşturulan mesajların istatistiksel analizini kullanarak bir mesaj kaynağının entropisini hesaplamayı mümkün kılar. Ancak ideal bir ergodik kaynak için bile, o kadar uzun hesaplamalar gerekir ki, bunları gerçekleştirmek neredeyse imkansızdır. Gerçek bir kaynak söz konusu olduğunda, örneğin İngilizce bir metin söz konusu olduğunda, genel olarak entropiyi hesaplamak için saf tarifler anlamsız olabilir.
Entropi değerine bir yaklaşım, önceki sembollerin kaynak tarafından belirli bir sembol yaratma olasılığı üzerindeki etkisi ihmal edilerek elde edilebilir. Bu yaklaşım her zaman entropiyi fazla tahmin eder ve kodlamak için gerçekte gerekenden daha fazla ikili karakter gerektirir. Bu nedenle, İngilizce metni harf harf kodlarsanız ve harflerin göreceli olma olasılıklarını bile ihmal ederseniz, harf başına 4.75 ikili karaktere ihtiyacınız vardır ve tüm kelimeleri bir kerede kodlarsanız ve kelimelerin göreceli olma olasılıklarını hesaba katarsanız, harf başına 2.14 ikili karaktere ihtiyacınız var .
Daha da geniş bir yaklaşıklık elde etmek isteseydik, o zaman İngiliz dilinin diğer özelliklerini, örneğin belirli bir kelimenin bir mesaj kaynağı tarafından üretilme olasılığına gramerin getirdiği kısıtlamaları hesaba katmamız gerekirdi.
İngilizce metni en verimli şekilde nasıl kodlayacağımızı henüz bilmesek de Shannon, İngilizce metnin entropisinin karakter başına 0,6 ile 1,3 bit arasında olması gerektiğini gösteren dahiyane bir deneyde başarılı oldu. Bu deneyde denek, çok sayıda harf içeren bir metin pasajında bir sonraki harfi tahmin etmek zorunda kaldı.
altıncı bölüm
DİL
VE
ANLAM
Bilgi teorisinin bir varlığı olarak iki büyük başarı kaydedilebilir. Birincisi, “kanal kapasitesi” kavramının tanıtılması ve özellikle belirli bir kaynaktan bilgi iletmek için gereken ikili basamak sayısının belirlenmesi ve ikincisi, sisli herhangi bir iletişim kanalının böyle bir hıza sahip olduğunun kanıtı bilginin iletildiği (sembol başına bit veya saniye başına bit olarak ölçülür), gürültü olmamasına rağmen bilgilerin hatasız iletilmesinin mümkün olduğu noktaya kadar. Bu sonuçlar ayrık ve sürekli kaynaklar ve kanallar için geçerli olmalıdır.
Bu kitabın ilk dört bölümü bir hazırlık olarak kabul edilebilir ve bir önceki bölümde özetlenen sorunu, yani bir bilgisayar tarafından üretilen bilgiyi iletmek için gereken ikili basamak sayısını bulma sorununu anlamak için basit olmaktan çok uzak olduğu söylenmelidir. ayrık ergodik kaynak. Kitap bilgi teorisine ayrılmış olsaydı, o zaman geleneksel olarak gürültülü ayrı bir kanalı ve ardından sürekli bir ergodik kanalı dikkate almamız gerekirdi.
Bununla birlikte, bu geleneksel yolu izlersek, o zaman kaçınılmaz olarak (yalnızca yaklaşık olarak ergodik olarak kabul edilebilecek) gerçek mesaj kaynaklarının incelenmesine ve ayrıca bu tür kaynakların entropisinin hesaplanmasına ve verimli yöntemlere geri dönmemiz gerekir. onlar tarafından üretilen mesajların kodlanması.
Ancak bilgi teorisinin katı açıklama dizisinden uzaklaşmak daha heyecan verici değil mi? Belki de bilgi teorisi - dil açısından iletişimin ana biçimine biraz dikkat etmeli ve durmalıyız? Dünyamızın bu en önemli fenomenini, çok büyük olmasa da tırmanmayı başardığımız yüksekliklerden inceleyerek neden biraz hayal kurmuyoruz? Edindiğimiz bilgilerin ışığında dilin en genel sorunlarının bizim için değişip değişmediğini görmemek için mi?
Ancak burada okuyucuyu dikkatli olması konusunda uyarmalıyız. Şimdiye kadar, odak bildiklerimiz üzerinde olmuştur . Bildiklerimiz bilimin temelidir. Ancak bir bilim insanının bilgisini uzman olmayan biriyle paylaşması kolay değildir. Bilimin kazanımları hakkında belirli miktarda bilgiyi anlamak ve özümsemek için çok fazla beyin çalışması gerekiyor ve korkarım ki bu önceki bölümleri okurken de gerekliydi.
Doğru, bilimi tanımanın daha basit ve tamamen anlamsız olmayan başka bir yolu var. Bir bilim adamı ve uzman olmayan biri için temelde farklı olan bir tür aydınlanmış cehaletten bahsediyorum. Çünkü bilim adamının kendine özgü cehaletinin dayandığı yerleşik gerçekler ve teorilerin toplamı, onun muhakemesinden pek çok saçmalığı dışlar. Bilim adamının cehaletinin daha yüksek ve daha belirsiz seviyeleri, Evrenin kökenini, bilginin mutlak temellerini ve modern bilimsel bilgimiz ile politika, özgür irade ve ahlak arasındaki ilişkiyi anlama sorularını kapsar. Bu bölümde, benim "dil hakkında bilimsel olarak aydınlanmış cehalet" olarak adlandırdığım amatör spekülasyonları ele alacağız.
Çok dikkatli olunması gerektiğine dair uyarımız şöyle detaylandırılabilir: Bu bölümde sunacaklarımızın çoğu, aydınlanmış cehaletten başka bir şey değildir. Uzman olmayan birinin bilimsel cehaleti bilimsel gerçeklerden ayırt etmesi çok zor olduğundan, bu konuda uyarmak daha da gereklidir. Ayrıca, zorunlu olarak, bu bilimsel cehalet genellikle daha genel, daha şematik bir biçimde, çok muğlak olmayan terimler kullanılarak ifade edilir ve bu nedenle daha anlaşılır ve aynı zamanda romantiktir, çünkü büyük ve çözülmemiş sorunları ilgilendirir. Genel olarak, bilimsel cehalet, bilimsel gerçeklerden daha popüler ve daha değerlidir.
Ancak böyle bir cehalet, uzman olmayan biri için ne gibi tehlikeler getirirse getirsin, bir bilim insanı için değerlidir. Değerlidir, çünkü keşfedilmemiş uzak diyarların ve fethedilmemiş zirvelerin vizyonu, bilim adamını kendini beğenmişlikten kurtarır ve onu günlük işlerin sıkıcı rutininin üzerine çıkarır. Ancak bir bilim adamı cehaletini gösterdiğinde, genellikle ne yaptığını iyi bilir, ancak uyarılmadan uzman olmayan kişi genellikle bunu bilmez ve fakir, kaderin insafına terk edilmiş, kararsız bulutlarda süzülür, katıya giremez. bilgi zemini.
Ve şimdi, uyarımızı dikkate alarak, dil ile daha önce tanıştığımız yere dönelim ve açıklamamıza devam edelim.
Sadece dilbilgisi açısından doğru İngilizce hakkında konuşacağız. Hepimiz (ve özellikle anlamlı gibi görünen konuşmaları veya teknik konuşmaları duyma talihsizliğini yaşayanlar) İngilizce konuşmaların çoğunun gramer açısından yanlış olduğunu biliyoruz. Aynısı, çoğu konuşma dili kuralı ve dil klişesi için de geçerlidir. "Te yığın büyük şef" (patronum) ifadesi , dilbilgisi açısından elbette kesinlikle yanlış olsa da, ülkemiz genelinde oldukça anlaşılırdır. Örneğin püristler, ikinci sınıf şiirin özelliği olan ters kelime sırasının gramer doğruluğunu kabul etmezler.
Bu nedenle, dilbilgisi açısından doğru İngilizce tartışması, hiçbir şekilde tüm konuşma ve yazma çeşitlerini kapsamaz, ancak konuya olan ilgimizi kaybetmeden ve kaybolmadan izleyebileceğimiz bir yolu ana hatlarıyla belirtir.
İngilizce metinle karıştırılabilecek bir şey yazmak istiyorsanız, belirli kurallara uymanız gerektiğini zaten söylemiştik. Herhangi bir kelimeyi birbiri ardına basitçe yazamayız. Bir dilin eksiksiz bir dilbilgisi, tüm bu kuralları içermelidir; bu kurallar, belirli bir tarihsel dönemde ve genel olarak kabul edilen bazı standartlara göre dilbilgisi açısından doğru cümleler olarak kabul edilecek olan İngilizce kelime dizilerini oluşturmak için bir kuralı da içermelidir.
Bir veya başka bir yapının dilbilgisel olarak düzeltilmesine atfedilmesi tartışmalı ve belirsiz bir sorudur. King James İncilinin tercümanları, "korkma" (korkma), "günah işleme" (günah işleme) ve "konuşma" (konuşma) ve "düşünme" ifadelerini özgürce kullandılar ( düşünme) veya "sahip olma" ( sahip olma) ve sık sık "isteme, israf etme" aforizmasını tekrarlıyoruz (istemiyorsan, harcama). Ama modern konuşma dilinde veya yazıda aynı anlamda "korkma", "günah işleme" veya "konuşma" demeliyiz ve yukarıdaki aforizmayı şöyle ifade edebiliriz: " istemiyorsan , israf etmemelisin . Dil bilgisi doğruluğu kavramı zamanla değişir. Bunu not ettikten sonra devam edelim.
Elbette dilbilgisi, tüm olası dilbilgisi açısından doğru ve yalnızca dilbilgisi açısından doğru ifadelerin oluşturulması için belirli kurallar koymalıdır. Ek olarak, tatmin edici dilbilgisi kuralları, kişinin bir cümleyi, bu dilbilgisi kurallarının dikte ettiği şeyi diğer her şeyden ayırt edebilecek şekilde analiz etmesine izin vermelidir. Elimizin altındaki bu tür kurallarla, İngilizce metnin entropisini yeniden değerlendirebiliriz, çünkü cümlede neyin bu kuralların yerine getirilmesini yalnızca mekanik olarak yansıttığını ve neyin seçme özgürlüğüne izin verdiğini veya belirsizliği ortaya çıkardığını ve bu nedenle neyin yol açtığını açıkça görebiliriz. entropinin artmasına neden olur.
Dahası, yalnızca cümleler kurarken seçilenlerle ilgili bilgileri başarılı bir şekilde iletebildik ; alıcı tarafta, alınan mesaja dayalı olarak doğru cümleler kuran bir dilbilgisi makinesi meselesi olacaktır.
Ancak, elbette, dilbilgisi dilin tüm zenginliğini tüketmekten çok uzaktır, çünkü bir cümle, dilbilgisi açısından doğru olsa bile çok tuhaf olabilir. Belirli bir sözcük listesinden rasgele seçerek yalnızca dilbilgisi açısından doğru cümleler kurabilen bir makine hayal edilebilir. Böyle bir makine, örneğin şöyle bir cümle kurabilir: " Chartreuse semiquaver, manifoldun hislerinin derisini yüzdü." (Chartreuse'nin çifte notası, çeşitlilik duygularını ortaya çıkardı.) Bir kişinin, " Mavi nota kalabalığın duygularını körükledi " diyerek başka bazı düşüncelere dayalı bir seçim yaptığı varsayılmalıdır. (Mavi nota büyük bir izleyici kitlesini etkiledi.) Fark, kuralların kendisinde değil, dilbilgisi kurallarına göre yapılan kelime seçiminde yatmaktadır. Dilbilgisi bilgisi bize dilin tüm sırlarını açığa çıkarmayacak, ancak bu olguyu anlamada ileriye doğru daha büyük bir adım atmamıza yardımcı olacaktır.
Seçim tesadüfen yapılsa bile, sadece gramer olarak doğru cümlelerin ve tüm dilbilgisi olarak doğru cümlelerin oluşturulmasında ne tür kurallar geçerli olacaktır? 3. Bölüm'de , kelimeleri gerçek cümlelerde bulunma olasılıklarına göre rastgele seçerek kelime dizilerini nasıl oluşturabileceğimizi gördük ; kelimeler. Kelime düzeyinde ikinci dereceden bir yaklaşıklık örneği de burada verilmişti, burada kelime verilen kelimeyi takip etme sıklığına göre seçilmişti.
Birikmiş İngilizce bilgisine dayanarak, daha yüksek mertebeden yaklaşımlar oluşturulabilir. Örneğin, birisine arka arkaya yazılmış üç kelimeyi gösterip ondan bu dizinin geçtiği bir cümle oluşturmasını ve buna anlam olarak bir sonraki kelimeyi eklemesini isteyerek dördüncü dereceden kelime seviyesinde bir yaklaşım elde edilebilir. Birkaç kişiden bu işlemi sırayla gerçekleştirmesini isterseniz, örneğin aşağıdaki gibi uzun kelime dizileri elde edebilirsiniz:
Bir vahşi terkediş alemin ardından sabah ağardığında, burada neyi ifade eden bir dizi kelimeyle dikey olarak hizalanmış başını salladığını söyledi. (Çılgınca bir sefahat âleminin ardından sabah olduğunda, burada başını sallayarak, ne anlama gelen bir dizi kelimeyi seçerek dedi.)
Duvara karşı zarafetle sallanan ağaçların donmuş görüntüsü belirdi . (Duvarın arka planına karşı zarif bir şekilde sallanan donmuş ağaçların göründüğü ortaya çıktı.)
Kuşkonmaz pişirildiğinde elmayı andıran lezzetli bir tada sahiptir. (Pişirildiğinde kuşkonmaz hoş, elmaya benzer bir tada sahiptir.)
Onu en son yaşadığında görmüştüm . (Onu en son yaşadığı zaman görmüştüm.)
Bu "cümleler" sahip oldukları anlama sahiptir, çünkü kelimelerin seçimi daha önce olduğu gibi tesadüfen değil, düşünen bir varlık tarafından yapılmıştır. Bununla birlikte, bu kurallar ve anlamsal bağlantılar yalnızca dört kelimeye uygulansa da (her derleyiciye üç kelime verildi ve dördüncüsünü kendisi ekledi) dilbilgisi açısından şaşırtıcı derecede doğru olduklarına dikkat edilmelidir. Yine de dördüncü örnek, İngilizce dilbilgisi açısından belki biraz şüphelidir.
karakter başına yaklaşık 1 bit olduğuna inanırsak , o zaman dört kelimelik bir grup seçmek için yaklaşık 22 ikili seçenek gerekir, başka bir deyişle, kişi 10 milyon arasından seçim yapmak zorunda kalır. dört kelimelik kombinasyonlar. Prensip olarak, bu kelime kombinasyonları listesini kullanarak bilgisayarın kelimeler eklemesini sağlamak mümkündür, ancak sonucun dilbilgisi açısından doğru olması gerekmez ve böyle beceriksiz bir yöntemin dilbilgisi açısından mümkün olan tüm kelimelerin oluşturulmasına yol açacağından hiçbir şekilde emin değiliz. kelime dizilerini düzeltin. Bir durumda dilbilgisi açısından doğru bir cümlenin parçasını oluşturabilen, ancak başka bir durumda oluşturamayan kelime dizileri var gibi görünüyor. Bu tür dizileri listeye dahil edersek, dilbilgisi açısından yanlış cümleler elde edebiliriz ve onları atarsak, dilbilgisi açısından doğru olan bazı cümleleri kaybederiz.
Dörtten fazla kelimeden oluşan diziler kullanma yoluna gidersek, o zaman listemizin eksiksizliğini gramer doğruluğu lehine takas ederiz. Dört kelimeden daha azını alırsak, dilbilgisini bütünlük adına feda etmiş oluruz. İkisini aynı anda almak imkansız.
Ve sonlu sayıda duruma sahip makinenin yeniden ortaya çıktığı yer burasıdır. Bu makinenin cümleler oluşturmasına izin verin ve cümlenin her noktasında, yani her durumda, bir sonraki duruma gitmesi gerektiğini seçmesine izin verin. Ayrıca, bu makinenin belirli kelime sınıfları veya alt sınıfları üzerinde çalışmasına izin verin, isimleri tekil veya çoğul olarak söyleyin, sıfatlar, parechias, çeşitli zaman ve sayı formlarındaki fiiller vb. tek sözcükler içerebilir, sözcük dizileri olması gerekmez.
Dilbilgisini sonlu sayıda duruma sahip bir makine olarak düşünme fikri çok caziptir, çünkü mekanistler bir kişinin sınırlı sayıda duruma sahip bir makine olduğunu iddia ederler, çünkü o sonlu sayıda hücreden oluşur ve eğer daha ileri gidersek, sonlu sayıda hücreden, atomlardan.
Parlak ve tanınmış bir çağdaş dilbilimci olan Noam Chomsky, sonlu durum makinesini bir gramer modeli olarak kullanmayı mümkün veya doğru bulmuyor. Bir makine tarafından yeniden yaratılamayan karakter dizileri oluşturmak için birçok kural verir. Örneğin, bunu yapabilirsiniz: harfleri rastgele seçeceğiz ve Z harfi görünene kadar arka arkaya yazacağız ... Sonra harfleri Z harfinden başlayarak ters sırada yazacağız . Z harfine kadar yeni harfleri seçin ve tekrar yazın vb.Sonuç, içinde bir düzenin olduğu çok uzun bir harf dizisidir. Ayrıca, iki Z harfi arasına alınmış bu dizinin olası uzunluğunun bir sınırı yoktur.
Bu süreci ve sonucunu modelleyebilecek sonlu sayıda duruma sahip böyle bir makine yoktur.
Chomsky, dilbilgisi açısından doğru İngilizce cümlelerin olası uzunluğunun bir sınırı olmadığını ve yapılarının doğasının, keyfi İngilizce metnin tüm varyantlarının kaynağı olarak herhangi bir sonlu durum makinesinin kullanılması olasılığını engellediğini savunuyor. Ancak öte yandan, gerçekten de bir mil uzunluğundaki bir cümlenin gramer açısından doğru olduğunu düşünebilir miyiz? Sonuçta, hiç kimsenin böyle bir cümle yazmadığını ve yazmayacağını herkes biliyor ve yazsaydı, o zaman kimse onu anlayamaz mıydı?
Bu sorunu çözmek için, bir dilbilgisi doğruluğu kriterine sahip olmak gerekir. Chomsky dilbilgisinin doğruluğu veya yanlışlığı sorununu ve bazı noktalama işaretleri sorularının yanı sıra anlam sorularını da konuşma İngilizcesi alanına yerleştiriyor gibi görünse de, onun kriterinin gerçekte şu olduğuna inanıyorum: bir cümle dilbilgisi açısından doğru kabul edilir. konuşmacı ve muhtemelen dinleyici, doğal tonlama ile anlamlı, ancak alt metin olmadan telaffuz edilmesi koşuluyla, dilbilgisi açısından doğru olduğunu düşünür. Birçoğu için çözmesi zor olan bir dizi başka sorun Chomsky'yi hiç rahatsız etmiyor çünkü kendisi İngilizce'yi inanılmaz bir akıcılıkla ve çok doğru konuşuyor.
Dilbilgisi kurallarının bir sonlu durum makinesinde uygulanıp uygulanmayacağına bakılmaksızın, Chomsky ikna edici bir şekilde, yalnızca önceden yazılmış kelimelere dayalı cümleler kurmaya çalışmanın yanlış ve çok zor olduğunu savunuyor. Buna karşılık, Chomsky bir teklifin aşağıda açıklanan sürece göre inşa edilmesini önerir.
Bir fiil tümcesi tarafından takip edilen nominal bir tümce gibi bazı temel cümle biçimleriyle başlıyoruz. Chomsky böyle özel bir cümle biçimini anahtar cümle olarak adlandırır. (çekirdek cümle). Ardından, böyle bir anahtar cümlenin her bir parçasını genişletmek için kurallara dönüyoruz. Nominal bir ifadeyle, onu her şeyden önce bir makale artı bir isim olarak temsil edebiliriz, örneğin " dokunma" (kişi). Bir fiil cümlesiyle, onu bir fiil artı bir nesne ve bir nesneyi bir makale artı bir isim olarak temsil edebiliriz ve belirli kelimeleri seçerek, örneğin "topa vur" (topa vur) elde ederiz . Seçtiğimiz anahtar cümleden (isim cümlesi artı fiil cümlesi) bu şekilde giderek “ topa vuran kişi” (topa vuran kişi) tam cümlesini elde ederiz. Herhangi bir aşamada, diğer kelimeleri ve diğer uzatma yöntemlerini seçmekte özgürüz, örneğin, "a girl catch a cat" (kiz kediyi yakaladı) cümlesini alabiliriz .
Burada cümledeki kelimelerin arka arkaya değil, farklı bir şekilde seçildiğini görüyoruz. En başından itibaren, gelecekteki tüm teklif için bir tür şematik plan veya yapı seçiyoruz. Bu yapı veya plan anahtar öneridir. Ve seçildikten sonra, ayrı bölümlerine geçiyoruz. Bu tür her parçadan bileşenlerine ve onlardan belirli kelimelere geçiyoruz. Ve son cümleyi elde etmek için, en başta seçtiğimiz anahtar cümleye dayalı olarak bu ağaç yapısının her dallanma düğümünde bir seçim yapıyoruz.
Chomsky'nin fikirlerini çok eksik ve çok şematik olarak sundum. Örneğin, Chomsky, kelimelerin düzensiz biçimleriyle karşılaştığında, bunları işlerken önce kelimenin kökünü ve onun gramer biçimini belirtir ve ardından kelimenin gerekli biçiminin elde edildiği belirli zorunlu kuralları uygular. Sonuç olarak, bir teklifin oluşturulduğu böyle bir dallanma yapısıyla, yalnızca seçimin uygulanmasına izin veren zorunlu kurallar değil, aynı zamanda tamamen mekanik, kesin olarak tanımlanmış, seçime izin vermeyen zorunlu kurallar da kullanılır.
ve orada atıfta bulunduğu eserlere bakmak gerekir .
Chomsky, elbette, cümle belirsizliği sorunuyla şu şekilde uğraşmak zorunda kaldı: " Bayan bilim adamı, yemek yerken rohot'u hızlı yaptı." (Kelimenin tam anlamıyla tercümesi: “Bir kadın araştırmacı yemek yerken robotu çalıştırdı.”) Eğitimli bir bilgi teorisyeni olan bu cümlenin yazarı, bunun en az dört farklı şekilde anlaşılabileceğini söylüyor (çok iyi bir yorum olmadığını kabul ediyor). ). Ama bana öyle geliyor ki bu öneri ayrıntılı bir analiz için örnek teşkil edemeyecek kadar karmaşık.
Belirsizlik, yalnızca bir veya daha fazla sözcük aynı gramer yapısı içinde farklı anlamlar aldığında ortaya çıkıyor gibi görünebilir. Bu, "deliydi" (kızgındı veya akıl hastasıydı) veya "pilot yüksekti" (pilot gökyüzünde yüksekti veya pilot bir derecenin altındaydı) gibi ifadeler için geçerlidir . Ancak Chomsky, muğlaklığın tamamen gramerle ilgili olduğu basit bir örnek verir. "Avcıların vurulması" ifadesinde isim avcıları , "aslanların büyümesi" ifadesindeki gibi eylemin öznesi veya "aslanların büyümesi" ifadesindeki gibi eylemin nesnesi olarak hareket edebilirler. çiçekler" .
Chomsky, farklı anahtar cümlelere uygulanan farklı dönüştürme kurallarının, son cümlede aynı gramer öğeleri dizisine yol açabileceğini gösteriyor. Böylece, "resim gerçek bir sanatçı tarafından yapılmıştır " (resim gerçek bir sanatçı tarafından yapılmıştır) ve "resim yeni bir teknikle boyanmıştır" (resim yeni bir tarzda boyanmıştır) cümleleri kelimesi kelimesine çakışmaktadır. gramer yapısı açısından.. Oysa birinci cümle " resmi gerçek bir ressam yapmıştır" (resmi gerçek bir ressam yapmıştır) cümlesine dönüşüm uygulansa da ikinci cümle böyle bir yapıya sahip bir cümleye dönüşüm uygulansa ortaya çıkamaz. . Son cümlede hem kelimeler hem de dilbilgisi yapıları aynı olduğunda, cümle belirsizdir.
Chomsky ayrıca dilbilgisi ile bir dildeki kelimelerin anlamı arasına bir çizgi çekmenin zorluğundan da bahseder. Dilbilgisi açısından bir ismin bir sıfatla tanımlanabileceğini ve bir zarfla tanımlanamayacağını söyleyebilir miyiz? Ama sonra "renksiz yeşil" (renksiz yeşil) yazabilirsiniz . Dilbilgisi bazı sıfatların bazı isimlerle, bazı isimlerin bazı fiillerle vb. kombinasyonlarını yasaklayabilir mi? D.? Bazı durumlarda dilbilgisi açısından doğru yapılar anlamsızken, diğerlerinde dilbilgisi açısından yanlıştır.
Chomsky'nin bir cümle kurma sürecinde belirli zorunlu veya isteğe bağlı eylemlerin yerine getirilmesini gerektiren bir İngilizce dilbilgisi sistemi önerdiğini görüyoruz. Böyle bir dilbilgisinin izin verdiği süreç, sonlu sayıda duruma sahip bir makine tarafından yeniden üretilemez, ancak daha evrensel bir makine, bir Turing makinesi tarafından gerçekleştirilebilir . Sonlu sayıda duruma sahip, üzerine karakterlerin yazıldığı ve okunup silinebildiği sonsuz uzunlukta bir bantla donatılmış bir makinedir. Chomsky dilbilgisi ile böyle bir makine arasındaki ilişkinin incelenmesi, otomata kuramıyla ilgilenenleri ilgilendirir.
Bununla birlikte, bir cümlenin uzunluğunu keyfi olarak bin veya bir milyon kelimeyle sınırlandırırsak, o zaman bile Chomsky'nin dilbilgisinin sonlu sayıda duruma sahip bir makineye karşılık geleceğini not etmeliyiz. Bir cümlenin uzunluğuna ilişkin böyle bir kısıtlama, pratik açıdan çok makuldür.
Chomsky'nin önerdiği türden bir gramerin genel bir tanımı veya modeli verildiğinde, şu soru sorulabilir: kurallara göre bir metin üreten bir mesaj kaynağının seçiminin veya belirsizliğinin bir ölçüsü olarak entropi hangi koşullar altında ve nasıl hesaplanabilir? bu gramerin? Bu sorunun cevabı, bilgi teorisi uzmanları olan matematikçilerden beklenebilir.
Yeterince eksiksiz ve uygun bir dilbilgisi oluşturmak çok daha önemlidir. Bu , Chomsky'nin önerdiği bağlam grameri veya başka herhangi biri olabilir . Böyle bir dilbilgisi, İngilizcenin dilbilgisi açısından doğru bazı yapılarını ondan inşa etmenin ve analiz etmenin mümkün olmayacağı anlamında eksik olabilir. Bununla birlikte, teklif oluşturma işlemlerinin, bir kişinin bunu nasıl yaptığına daha yakından karşılık gelmesi daha önemlidir. Ayrıca bu dilbilgisi, bilgisayarların yardımıyla metni hem oluşturabilecek hem de çözümleyebilecek kadar basit olmalıdır. Problemlerin çözümünde makinelerin mutlaka kullanılması gerektiğine inanıyorum.
İngilizce metnin yapısını ve istatistiklerini inceleme lemmaları.
Birçoğu Chomsky'nin yönteminin dilbilgisinin çok önemli bir yönü olduğuna inanıyor, ancak yine de bazıları onun önerdiği cümle kurma resminin, bir kişinin nasıl cümle kurduğunun açıklamasına uygulanabilmesi için değiştirilmesi veya daraltılması gerektiğine inanıyor. Konuşurken veya dinlerken, kişi cümlenin temelde baştan sona kurulduğundan oldukça emindir. Bize öyle geliyor ki, bir kişi konuşmaya (veya yazmaya) başladığında, kafasında dikkatlice hazırlanmış bir cümle planı yok. Bu plan, konuşma sırasında belirtilir.
Sanırım çok da uzak olmayan bir gelecekte dilbilgisi fenomenleri ve bunların kullanım istatistikleri üzerine yapılan çalışmalar bize dilin doğasında ve aynı zamanda insanın doğasında birçok yeni şeyi ortaya çıkaracaktır. Ama şimdi daha kesin bir şey söylemek için, hem kendimin hem de başkalarının modern bilgisinin önüne geçmem gerekiyor.
Dilbilgisi, yalnızca çeşitli türlerdeki sözcükleri dilbilgisi açısından doğru kombinasyonlarda birleştirmenin kurallarını değil, aynı zamanda İngiliz dilinin sözcüklerini, dilbilgisi yapılarında işgal edebilecekleri yere bağlı olarak sınıflara ayırmayı da belirlemelidir. Dilbilimciler, anlamsal anlamdan soyutlayarak, yalnızca gramer işlevine dayalı olarak böyle bir ayrım yaparlar. Dolayısıyla bir gramerden bekleyebileceğimiz tek şey, yukarıdaki örneğin geçerli olduğu dilbilgisi açısından doğru cümlelerin inşasıdır: " Chartreuse semiquaver, manifoldun duygularının derisini yüzdü". (Chartreuse'deki çift nota, bir çeşitlilik duygusunu açığa çıkardı.) Ancak, elbette, sözcüklerin isimler, sıfatlar ve fiiller gibi gramer kategorilerine bölünmesi, bu yapıyı oluştururken sözcükleri seçmede insanları yönlendiren tek kriter değildir. ya da o cümle.
Öyleyse, dilbilgisi açısından doğru cümleler kurarken seçilen kelimeler neye dayanarak, rastgele bir seçim yapan bir makine değil, uzun uygulama sonucunda dilbilgisi kurallarına göre konuşmayı öğrenmiş bir kişi olduğunda? Belirsiz "anlam" kelimesi bu soruyu cevaplayamaz. Şüphesiz, kriter 140
oluşturulan cümlelerin doğruluğu çok zor olabilir. Pek çok kuşak filozof ve psikolog, dilin sorunlarını ve sözcüklerin kullanımını incelemiş ve çeşitli hipotezler oluşturmuştur. Ve şimdi bu alanda tamamen yeni bir şey veya tamamen doğru bir şey söylemek hala zor. 18. yüzyılda , Piskopos Berkeley dil hakkında o kadar zekice yazdı ki, şimdi bile kimse onun düşüncelerinin mantığına ve derinliğine saygı göstermeden edemez.
Klasik bir şairin (yani ritmik ve kafiyeli şiirler yazan biri) gramer açısından doğru bir şiir yazmak için oturduğunu varsayalım. Çoğu zaman, aldığı ölçüye uyan, birbiriyle kafiyeli ve niyetini karşılayan sözcüklerin seçimine ve ayrıca aliterasyon ve diğer arzu edilen ahenkli tekrarların tanıtılmasına harcayacaktır. Bu, Edgar Poe'nun "Çanlar", "Ulyalum" ve "Kuzgun" şiirlerinde çok iyi bir şekilde gösterilmiştir.
kelimelerini , sesleri ve anlamları okuyucuda veya dinleyicide istenen duygu veya izlenimleri uyandıracak şekilde birleştirmeye çalışır . İşte Edgar Poe'nun söylenenleri mükemmel bir şekilde doğrulayan "Çanlar" ("Çanlar") şiirinden bir alıntı .
Nasıl da çıngırdıyorlar, çıngırdıyorlar, çıngırdıyorlardı, Gecenin buz gibi havasında !
Tüm göklere Fışkıran yıldızlar , kristal bir zevkle parlar gibi görünürken ...
Bazen şiir, Poe'nun şiirlerinde çok belirgin olan doğrudan anlamdan yoksun olsa bile, şairin yarattığı resim sesli, pürüzsüz ve canlı olabilir.
Şiirden bahsetmiyorsak, kelimeler ahenk sağlamak için seçilebilir, ancak muhtemelen çoğu zaman uyandırabilecekleri çağrışımlar için seçilirler, insan duygularını etkileme yeteneği , özellikle Berkeley tarafından sıralananlar: korku, aşk, nefret, hayranlık ve aşağılama. Bireysel kelimeler ve ifadeler herkeste bu tür duygular uyandırır. Belirli tarihsel koşullar altında, çoğu insan üzerinde eşit derecede güçlü bir etkiye sahip olan kelimeler ve ifadeler vardır, tıpkı gerçeklik resimleri, bu kelime ve ifadelerin ilişkilendirildiği sesler ve olaylar gibi. Böylece bir duanın sözleri güçlü dinsel duygular uyandırabilir; siyasi veya ırkçı lakaplar - endişe veya aşağılama ve kirli şakalar - ne olduğunu biliyorsunuz.
Berkeley başka bir duyudan, anlama duygusundan bahsetmiyor. Kötü anlaşılan hakkında sıradan ve alışılmış terimlerle konuşarak, yaşam, bilginin doğası, bilinç, ölüm ve takdir gibi karmaşık kategorileri tartışırken derin bir anlayış duygusu yaratabiliriz. Görünüşe göre, sıradan sözcükleri kullanmanın bu yöntemi, akıl alanından çok insan duyguları alanı için daha uygundur.
Tüm hayatınızı sözcükleri seçme nedenlerini analiz ederek geçirebilirsiniz, ancak bunu yaparken, kaçınılmaz olarak her zaman anlam sorununa geri dönmek zorunda kalacaksınız. Her ne ise, onsuz, diğer her şeye ihtiyaç yoktur. Çince konuşamıyorsam, yalnızca dili iyi bilen birinin anlayacağı şekilde bir şiiri, bir duayı, bir sitemi veya bir şakayı anlayamayacağım.
Tanınmış bir bilgi teorisyeni olan Colin Cherry itiraz etse de, insan dilinin bir tür kod olduğuna inanıyorum. Elbette bu, belirli bir kelimenin işaret ettiği fenomenin yerine mekanik olarak ikame edildiği basit bir kod değildir. İlk kriptograflar tarafından kullanılan karmaşık kodlara oldukça benzer; burada bir harf veya kelime, zevke göre seçilen (dilin gerçek istatistiklerini bozmak için) tekrarlanmayan kod kelimelerin tüm listesine karşılık gelir. Ancak bir dilde bu tür "listeler" çakışabilir ve bir kişinin kod defteri diğerinin kod defteriyle eşleşmeyebilir ve bu kesinlikle karışıklığa neden olur.
Dili kusurlu bir kod olarak kabul edersek, kaçınılmaz olarak sözcenin anlamını konuşmacının niyetine atfetmek zorunda kalacağız. Tüm kelimeleri iyi duysam bile, "Ne demek istiyorsun?" Uzak geçmişin Aitor'larının eserlerinde, bilim adamları akıllarından geçenlerin anlamını arıyorlar; ABD Yüksek Mahkemesi, Kongre'nin yasanın şu veya bu lafzını uygulayarak ne demek istediğini belirlemeye çalışıyor.
Diyelim ki, bir kişinin yalan söylediğine ikna olursam, söylediklerini beni pohpohlama veya beni aldatma arzusu olarak anlıyorum. Bir cümlenin bir bilgisayar tarafından yazıldığını fark edersem, bunu makinenin çok zekice programlanmış olduğunun bir işareti olarak kabul ederim.
Pek sapmadığımı düşünüyorum. konu dışı. Bana öyle geliyor ki, dil bazen uygunsuz bir şekilde kullanılan kusurlu bir kod olarak düşünülürse, kelimelerin anlamı hakkındaki bu düşünceler kaçınılmazdır. Doğal olarak, ele alınan sorunun tam olarak değerlendirilmesinden çok uzağız.
Bununla birlikte, dilbilgisi açısından doğru cümleler, ifadenin amacı ne olursa olsun, biçimsel bir anlamsal anlam olarak adlandırılabilecek bir şeye sahiptir. Tatmin edici bir dil bilgimiz olsaydı, o zaman makine bir cümledeki sözcükler arasında bağlantılar kurarak özneyi, yüklemin sözel kısmını, nesneyi, diğer sözcükleri tanımlayan sözcükleri ve ifadeleri bulabilirdi. Bir cümlenin biçimsel anlamsal anlamını oluşturma sorununun ardından, bir başkası ortaya çıkar - kelimeler ve nesneler, özellikler ve eylemler arasında bir bağlantı bulmak, yani insan toplumu ve birikmiş bilgi de dahil olmak üzere çevremizdeki dünyada var olan bağlantılar. .
Günlük iletişimde, sözcükleri tek tek nesneler, özellikler, eylemler ve ilişkilerle kolayca ve hatasız bir şekilde ilişkilendiririz. "Doğu penceresini kapat" veya "Henry öldü" ifadeleri normal bir ortamda söylenmişse ve belirsiz bir şekilde yorumlanamıyorsa kimse rahatsız olmaz. Amerika'da sıradan bir odada herkes az önce bahsettiğimiz pencereyi gösterecek; ne de olsa pencereleri her zaman kapatıyoruz ve doğunun nerede olduğunu iyi biliyoruz. Ve Henry'yi de tanıyoruz (Henry Smith'i Henry Jones ile karıştırmayacağız) ve ölüleri gördük. Yani cümleyi duymamış veya yanlış anlamamış olsak bile, o zaman ikinci seferde neredeyse kesin olarak anlayacağız.
Ama pencere hakkında böyle bir cümlenin, çatının ne olduğunu hiç bilmeyen bir insanı, cümle tam olarak jereyedena olsa bile, nasıl etkileyeceğini bir düşünün. Evet ve bize şu sorulursa kafamız karışabilir: "Virüs canlı mı ölü mü?"
Çoğu durumda, kelimeler ve gerçeklik nesneleri arasındaki ilişkideki kafa karışıklığı ve belirsizlik, görünüşe göre, bir pencere, bir kedi veya ölü bir insan gibi kavramları ilişkilendirerek anlamaya çalışan Platon'dan Locke'a kadar filozofların insafına kalıyor. onları genel bir fikir veya soyut örneklerle. Özellikle bir pencereyi tanımamız gerekiyor çünkü pencere genel fikrine, ideal pencereye ve bir kedi cinsinin tüm özelliklerini bünyesinde barındıran soyut bir kediye karşılık gelmesiyle bir kediye karşılık geliyor. Berkeley'in dediği gibi, soyut bir üçgen fikri (ideal üçgen) şu şekilde formüle edilmelidir: “ne eğik, ne dikdörtgen, ne eşkenar, ne ikizkenar, ama aynı zamanda tüm bu özellikler aynı anda ve hiçbiri. ”
bir virüste asla bulamayacağı bazı semptomlara dayanarak yapar . Dahası, doktor bir teşhis koyarsa, asla hastanın durumunun tüm semptomlarını hastalığın idealize edilmiş bir resmiyle sırayla karşılaştırarak işe başlamaz. Görünüm, sıcaklık, nabız, cilt durumu, boğaz vb. Gibi belirtilerle başlar ve ardından hastanın kendisine bahsettiği semptomları dikkate alır. Bilinen semptom kombinasyonları bazı hastalıkların karakteristiğidir ve ♦ daha doğru bir teşhis koymak için ek incelemeler veya araştırmalar yapılabilir.
Benzer şekilde, bir botanikçi bilinen veya bilinmeyen bir bitkiyi belirli özelliklerin varlığına veya yokluğuna göre tanımlar: yaprakların boyutu, rengi, şekli ve düzeni vb. diğerleri, diyor ki, boyutlar, yardımcı özellikler olarak hizmet edebilir. Sonuç olarak, botanikçi ya bitkiyi doğru tanımladığına ikna olur ya da doğru yaptığına inanmak ister ya da bitki tamamen yeni bir türün temsilcisi olarak ortaya çıkar.
Bu nedenle, hekimlerin ve botanikçilerin günlük çalışmalarında, idealize edilmiş bir hastalığı veya ideal bir bitkiyi güvenilir bir kriter olarak almak şüphelidir, çünkü bunlar basitçe mevcut değildir. Bunların yerine, bir kısmı belirleyici, bir kısmı yardımcı olan nitelikler veya özellikler listelerimiz var.
Yorumlarımızın değeri, sınıflandırma ve örüntü tanıma gerçekleştiren makinelerin yaratılması konusundaki son çalışmaların önemli sonuçlarıyla doğrulanmaktadır. Yanlış yolda (muhtemelen filozofların hatası nedeniyle) gerçekleştirilen bu yöndeki ilk çalışmalar, harfleri bu harfin ideal bir görüntüsüyle ve fonogramları belirli bir sesin ideal bir fonogramıyla karşılaştırmaktan ibaretti. Sonuçlar gerçekten korkunçtu. Audrey adında bir su aygırı kadar devasa, küçümsenmeye bile değmeyecek bir beyni olan bir örüntü tanıma makinesi, bir (veya birkaç) kişinin sesiyle söylenen sayıları tanıyabilirdi, ama ne yazık ki zavallı Audrey her fırsatta yanılıyordu. Bence, bir kişinin görüntüleri bu şekilde ancak son derece basit durumlarda tanıdığı sonucuna varmalıyız, eğer bunu yaparsa.
Daha sonra, daha ciddi araştırmacılar, tanınması için görüntünün temel özelliklerini aramaya başladılar. Bu nedenle, çok basit bir örnek olarak, Q harfinin tanınmasını ele alabiliriz. Büyük Q harfinin mükemmel bir görüntüsünü oluşturmak yerine , bu, köşeleri olmayan, dört ile altı arasında bir şey eklenmiş, dışbükey kapalı bir eğri olarak tanımlanabilir. saat *.
1959'da L. Harmon, Bell Telephone Laboratories'de sıfırdan dokuza kadar tam sözcüklerle yazılmış sayıları neredeyse doğru bir şekilde tanıyabilen birkaç pound ağırlığında basit bir cihaz yaptı . Bu cihazın el yazısıyla yazılmış simgeleri örneklerle karşılaştırdığını düşünüyor musunuz? Hiç de bile! Sadece kalemin belirli bir çizginin üstünden veya altından kaç kez geçtiğini ve i'de noktaların ve t'de tirelerin olup olmadığını belirler .
Tabii ki, kelimelerin nesne sınıflarına, eylemlere vb. karşılık geldiğinden kimsenin şüphesi yok. Etrafımız çevrili ve çok sayıda sınıfla uğraşmak zorundayız.
* Yazar, saat kadranında hedefe yapılan vuruşları belirtmek için profesyonel atıcıların terminolojisini kullanıyor .
ve genellikle sözcükleri eşleştirebileceğimiz nesnelerin ve eylemlerin alt sınıfları. Bu, bitkiler (bezelye, ayçiçeği...), hayvanlar (kediler, köpekler...), arabalar (arabalar, radyolar...), binalar (evler, kuleler...), giysiler (pantolonlar, çoraplar...) gibi nesneleri içerir. ...), vb. Ayrıca giyinme ve soyunma (ben dahil dalgın insanlar bunu genellikle bilinçsizce yaparlar), ayakkabıların bağcıklarını bağlama (çocukların anlaması çok zor), yemek yeme gibi çok karmaşık eylem dizilerini de içerir. , araba kullanmak, okumak, yazmak, sayı toplamak, golf veya tenis oynamak (bunların hepsi bir dizi başka yardımcı faaliyet gerektiren faaliyetlerdir), müzik dinlemek, kızlara kur yapmak vb.
Bana öyle geliyor ki, belirli bir nesneler, özellikler, eylemler veya ilişkiler sınıfı, bazı soyut kalıplarla değil, özellikler kümeleriyle tanımlanır. Dahası, bir dizi özelliğin, deneyimi bir dizi mantıksal, kesinlikle sınırlandırılmış ve her şeyi kapsayan kategorilere ayırmamızı sağlaması beklenemez. İnsan deneyiminin dar alanının böylesine bir incelemesinde, bilim dili çok uygun olabilir, ancak günlük konuşma dilimiz böyle bir sınıflandırmayı son derece keyfi, belirsiz ve tam olmaktan uzak hale getirir. Yine de bana öyle geliyor ki kapıları, pencereleri, kedileri, köpekleri, insanları, maymunları vb. Bence koşma, zıplama, ayakkabı bağlama gibi yaygın etkinlikleri ve yazılı ve sözlü sözcükler gibi sembolleri bu şekilde tanıyoruz.
Ve bana öyle geliyor ki, ancak bu yöntemle, makinenin nesneleri ve insanlığın biriktirdiği deneyimi bir dilin sözcükleri biçiminde sınıflandırması veya bir dili tanıması ve bir dilden diğerine veya "dile" tercüme etmesi umulabilir. " eylemlerin. Dahası, karşılaştığımız kelime, onu kişisel deneyimlerimizden aşina olduğumuz kavramlarla ilişkilendirecek hiçbir şey vermiyorsa, o zaman dikkatli olma hakkına sahip olduğumuzdan eminim.
Dili başarılı bir şekilde kullanabilen bir makine yapma hayalimizi gerçekleştirmek için, bir dilbilgisine ve sözcükleri çevremizdeki dünyadaki şeylerle ilişkilendirmenin bir yoluna sahip olmalıyız. Ama bu hala yeterli olmaktan uzak. Cümlelerin anlamlı olmasını istiyorsak , bir şekilde gerçek hayata karşılık gelmeleri gerekir.
yeni nesneler ve olgularla karşılaşmıyoruz. Yeni, zaten tanıdık olan, ancak başka kombinasyonlarda karşılaştığımız fenomenlerin farklı bir sırayla iç içe geçmesi olarak hayatımıza girer. Bazen zaten birikmiş olana yeni nesneler ve fenomenler veya bunların yeni kombinasyonlarını ekleyerek yeni deneyimler kazanırız; hayatımızı bu şekilde zenginleştirir veya değiştiririz. Bazen bazı şeyleri unuturuz.
Eylemlerimiz çevremizdeki nesnelere ve olaylara bağlıdır. Arabadan kaçıyoruz (karmaşık bir hareket dizisi); susadığımızda, muslukta durup içiyoruz (başka bir karmaşık dizi, bu kez tekrarlayan hareketler). Bir kalabalığın içinde, birden çok kez yaptığımız gibi, birini uzaklaştırabiliriz. Ancak dünya hakkındaki tüm bilgimiz doğrudan gözlemlerden elde edilmiyor ve neyse ki başkaları üzerindeki etkimiz yalnızca şoklarla sınırlı değil. İnsanlarla iletişim kurmak için güçlü bir silahımız var - dil ve kelimeler.
Kelimeleri, nesneler ve eylemler arasındaki bağlantıları öğrenmek ve hatırlamak, başkalarından öğretmek veya onlardan bir şeyler öğrenmek, başkalarını bir şekilde etkilemek için kullanırız. Sözcüklerin kullanılabilmesi için muhatapların bunları aynı veya hemen hemen aynı nesne ve eylemlerle ilişkilendirmesi gerekir. Ancak, daha önce hiç okumamış veya eklememişse ve bunu nasıl yapacağını bilmiyorsa, bir kişiden bir sayı sütununu okumasını veya toplamasını istemek anlamsızdır. Hayatında hiç görmemişse, ondan karıncayiyeni vurmasını ve antilopu vurmamasını istemenin faydası yoktur.
Daha ileri gidelim. Sözcük dizilerinin anlamlı olması için, gerçek veya olası olay dizilerine karşılık gelmeleri gerekir. Bir kişiye Londra'dan New York'a öğleden sonra yürüyüş yapmasını tavsiye etmek anlamsızdır.
Bu nedenle, ifadelerin anlamlılığı bir dereceye kadar yalnızca dilbilgisel yapının doğruluğuna ve sözcükleri nesnelerle, nitelik kümeleriyle vb. İlişkilendirmenin şu veya bu yolunun uygunluğuna değil, aynı zamanda dünyanın yapısına da bağlıdır. biz. Bir cümleyi bir dilden diğerine çevirirken, onların “anlamını” doğru bir şekilde korumanın gerçek ve son derece ciddi zorluğuyla karşılaşırız .
Bariz zorluklardan biri, fenomenlerin sınıflandırılmasındaki farklılıktır. İngilizce'de bacağın alt kısmını "ayak" ve <<10wer yani g" olarak ayırırız, Ruslarda ise bunun için bir kelime vardır - "ayak". Macarlar parmaklar ve ayak parmakları arasında ayrım yapmazlar (İngilizce'de "ayak parmakları" - ayak parmakları ve "parmaklar" - parmaklar). Dişi ya da erkek bir çoğumuz için köpek köpektir ama bizden önce yaşayan insanların ortak bir "köpek" kelimesi yoktu , onu köpek (köpek) ve kaltak (orospu) kelimeleri olarak ayırdılar . Eskimoların farklı kar koşulları için birçok farklı kelimeleri olduğu söylenir. Biz bunları betimsel olarak ifade ediyoruz ve bu betimlemeler bizim için pek bir anlam ifade etmediği için bize pek bir şey anlatmıyor. Bu nedenle, farklı dilleri konuşanlar için ortak ve önemli olan çevremizdeki dünyanın unsurları, genellikle onlar tarafından farklı şekillerde sınıflara ayrılır ve dilbilimsel olarak farklı şekillerde anlaşılır. Aynı yaşam olgusunu farklı dillerde kelimelerle veya basit cümlelerle ifade etmek imkansızdır.
Ancak daha da ciddi bir sorun var. Dilde sergilenen yaşam deneyimi, farklı kültürlerde farklıdır. Tercüman, diyelim ki böyle bir cümlenin karşılaştığı bir romanı tercüme etme göreviyle karşı karşıya kalırsa ne yapmalı: "ayakkabı bağla" (daha önce de söylediğimiz gibi, karmaşık bir eylem anlamına gelir). Bunu sadece yalınayak yürüyen insanların diline nasıl çevirebiliriz? Çok ayrıntılı ve kapsamlı bir açıklama bile gelecekteki okuyucuya yardımcı olmayacaktır. Görünüşe göre, burada bu kültürün bazı eşdeğer özelliklerini aramamız gerekecek. Ve böyle bir zorluktan nasıl kurtulur: "bir ev inşa etti"? İlk yerleşimcilerle ilgili romanda bu, kendisinin ağaçları kestiği ve kütükleri kestiği anlamına gelir ve şimdi bu, bir mimarın ve inşaatçıların işiyle zaten ilişkilendirilmiştir!
Bir dilden ona benzer bir dile belirli bir tür kelime kelime veya en azından kelime öbeği satırlar arası çeviriyi uygulamak mümkündür, ancak böyle bir çevirinin bir zamanlar aşağıdaki sonuca yol açtığı söylenmektedir: "Gözden ırak, akıldan ırak" (gözden ırak , akıldan ırak) demek, " kör aptal" olarak çevrilmiştir. Diller ve kültürler önemli ölçüde farklıysa, tercüman kelimelerin anlamını doğrudan nesneler, eylemler veya duygular aracılığıyla oluşturmak için kafa yormalı ve ardından bu kavramları başka bir dile aktarmalıdır. Ancak, elbette, ne dillerin ne de kültürlerin, tercüme edilmesi gereken nesnelerin veya eylemlerin yakın eşdeğerleri olmayabilir. Sonra çevirmenin başı belaya girdi.
Ancak bir çeviri makinesinin tasarımını üstlenmiş bir kişi böyle bir zorlukla nasıl başa çıkabilir? İnsanlarda "anlama" dediğimiz şeyi başarıyla yapmayı makineye "öğretmenin" bir yolunu kaçınılmaz olarak bulması gerekecek. Ancak bir dilden diğerine çeviri söz konusu olmadığında bile anlamak gerekir. Böylece, gerçekliğe karşı günah işlemeden, Omsk'taki amcasının ölüm sahnesini Oklahoma'daki babasının ölüm sahnesine çevirebilen bir senarist, birden fazla saçmalık yapacak ve basit bir ifadeyi başka kelimelerle ifade etmeye çalışacak. bilimsel bir konu Bu anlaşılabilir - kederi anlıyor ama bilimi anlamıyor.
Anlam ve anlam terimlerini zahmetli bir şekilde anladıktan sonra , anlama kelimesini anlama sorunuyla karşı karşıya kaldık . Bize öyle geliyor ki, bu kelimenin sanki iki yüzü var. Cebirden veya matematikten anlıyorsak, onların formüllerini daha önce karşılaşmadığımız problemleri çözmek için veya daha önce duymadığımız bir teoremi ispatlamak için uygulayabiliriz. Bu anlamda anlayış, yeni bir şey yapma, yaratma ve sadece tekrar etme yeteneğinde ifade edilir. Matematiksel mantığın bilmediği bir teoremini ispatlayan bir elektronik bilgisayar hakkında (ve bunu uygun bir program derleyerek yapmak zor değil), konuyu bir dereceye kadar anladığını söyleyebiliriz. Ancak anlama kelimesinin duygularla ilgili başka bir anlamı daha vardır. Bir teoremi çeşitli şekillerde ispatlayabilir ve diğer teoremler ve gerçeklerle ilişkilendirebilirsek, bir probleme farklı bakış açılarından yaklaşabilir ve aynı zamanda bu yaklaşımlar arasındaki bağlantıyı görebilirsek, o zaman derinden anladığımızı söyleriz. sorun veya konu.. Ve görevin üstesinden gelebileceğimize dair hoş bir güven duygusuyla kalplerimiz ısınır. Elbette bazen ruhtaki bu sıcaklık hissi yeterli sebep olmadan ortaya çıkar. Bir şeyler hissediyoruz ama hiçbir şey yapamıyoruz. Ve kritik bir anda ne kadar hayal kırıklığına uğradık!
Dili bilgi kuramı açısından düşünerek, sözcüklerin akıntısında yüzdük, dilbilgisi kurallarının bulanık nehirlerinde yelken açtık ve anlam ve anlayış ormanına tırmandık. Cehaletin nereye götürebileceğini gördük. Enformasyon kuramının ya da buna benzer herhangi bir şeyin dilbilim, anlam, anlayış, felsefe ve yaşam sorunlarını çözmemize yardımcı olacağını iddia etmek saçma olur. En iyi ihtimalle, dilin biçimsel çerçevesinin biraz ötesine geçtiğimizi ve dilin kendisinin bize açtığı seçim olasılıklarının ufukta belirdiğini söyleyebiliriz. Dilin kullanımı ve işlevi hakkında bakış açıları sunduk, ancak bunları kesin olarak tanımlamadık. Okuyucu, ilgili konulardaki aydınlanmış bilgisizliğime dayanarak, benim görüşüme katılmakta veya bu tür bir cehaletin kendi versiyonunu seçmekte özgürdür.
Yedinci Bölüm
VERİMLİ
KODLAMA
Doğayı bir daha asla Yunan filozoflarının bir zamanlar anladığı gibi anlamayacağız. Doğa olaylarının eski Yunanlıların yaptığı gibi birkaç kapsamlı ilkeye dayalı olarak açıklanması artık bizi tatmin etmemektedir. Çok fazla şey biliyoruz. Yunanlıların şüphelenmediği şeyleri açıklamak zorundayız. Ve bu nedenle teorilerin açıklamaya çalıştıkları fenomen yelpazesiyle her ayrıntıda uyuşmasını istemiyoruz. Teoriden sadece rasyonel ihtiyacımız yok
belirli bir fenomenin doğal bir açıklaması, aynı zamanda faydalı bir rehber. Newton mekaniğinin gücü, insana gezegenlerin ve uyduların konumlarını tahmin etme ve diğer birçok doğa olayını anlama fırsatı vermesi gerçeğinde yatmaktadır ve bir zamanlar basit bir mekanik görüşü esinlemiş ve desteklemiş olmasında değil. yaşam için de dahil olmak üzere dünyanın fenomenleri.
Modern fizikçiler şanslı. Aslında, farklı kütlelere ve yüklere sahip elektronların ve atom çekirdeğinin var olduğu varsayımı, bilinen kuantum yasalarını kullanarak maddenin herhangi bir (kuantum olmayan) fiziksel, kimyasal ve biyolojik özelliklerinin tam ve doğru bir şekilde açıklanması için ilke olarak oldukça yeterlidir. . Doğru, bugüne kadar yalnızca tek bir fiziksel sistemin - izole edilmiş bir hidrojen atomunun - özelliklerini doğru bir şekilde hesaplamanın mümkün olması biraz utanç verici.
Fizikçiler diğer bazı fenomenleri oldukça doğru bir şekilde tahmin edebilir ve açıklayabilirler, ancak çok daha fazla sayıda fenomeni yalnızca tanımlayıcı olarak açıklayabilirler. Ancak, diğer deneysel verileri hesaba katmadan, yalnızca elektronik nükleer ve kuantum yasalarına dayanan kesin bir teorik yorum, pek çok sıradan termal, mekanik, elektrik, manyetik ve kimyasal olayı açıklamak için yetersizdir. Temel kuantum süreçlerinden başlayarak karmaşık biyolojik olaylarda neler olup bittiğini izlemek o kadar zordur ki, bu yöntemin biyolojideki gerçek sorunları çözmek için pek önerilmesi mümkün değildir. Bunun neden böyle olduğunu daha iyi anlamak için, matematiğin önemli dallarından birinin aksiyomlarını bildiğimiz halde, ancak en basit teoremleri ispatlayabileceğimizi hayal edin.
Bu nedenle, prensipte ne kadar doğru olursa olsun, tek bir evrensel teoride birleştirmeye çalışmanın umutsuz olduğu çok sayıda ilgi çekici sorun ve fenomenle çevriliyiz. Yakın zamana kadar, doğadaki tüm gizemli fenomenler arasında çoğu kişi için en ilginç olanı, genellikle fiziksel olarak adlandırdığımız fenomenlerdi. Günümüzde bilimsel araştırma için biyokimya ve fizyoloji problemlerinden daha heyecan verici bir konu bulmak zor.
Bununla birlikte, teknolojideki son gelişmelerin ortaya çıkardığı sorunların çoğu, bence, 152
aynı yakın ilgi. Elektronik bilgisayarların bir teoriyi kanıtlama ya da eskiden "insan" olarak düşündüğümüz özellikleri simüle etme olanaklarını keşfetmekten daha heyecan verici ne olabilir! Telekomünikasyonun ortaya çıkardığı sorunlar da dikkati hak ediyor. Hassas elektriksel ölçüm yöntemleri akustiği devrim yarattı. Telekomünikasyon araştırması, konuşma ve işitme çalışmalarında yeni bir çağ açtı ve daha önce kabul edilen fizyoloji, fonetik ve dilbilim fikirlerinin tutarsızlığını gösterdi. Matematiksel iletişim teorisinin veya bilgi teorisinin en doğrudan uygulandığı, büyük cehaletin ve çok az yeni bilginin bu kaotik ve merak uyandıran alanını keşfetmektir.
Bilgi kuramı, tıpkı Newton'un hareket yasaları gibi, var olma hakkını kanıtlamak için iletişim problemlerini çözmek için bize yararlı rehberlik sağlamalıdır. Olguları anlamak ve yönetmek için kalıcı öneme sahip bazı gerçek varlıkları yansıttığını kanıtlaması gerekir. Teorinin adından da anlaşılacağı gibi, bu öz, bilginin verimli ve doğru aktarımında bulunmalıdır. Hiç şüphe yok ki var. Gördüğümüz gibi, Shannon'ın çalışması bu varlığı anlaşılır kılmadan önce bile bundan şüphelenildi.
Bilginin tam olarak iletilmesi sorunu yeni fikirlerle bağlantılıdır; bir sonraki bölümde onlarla ilgileneceğiz. Bununla birlikte, önceki bölümlerin malzemesi, etkili bilgi iletişiminde bazı önemli konuları ele almamıza izin verir.
Sembol başına bit veya saniye başına bit cinsinden ölçülen bir bilgi kaynağının entropisinin, bir mesajı iletmek için gereken ikili basamakların veya sembol veya saniye başına açma-kapama darbelerinin bir ölçüsü olduğunu biliyoruz. Kodlama ve iletim için gereken minimum ikili basamak sayısını bildiğimizden, doğal olarak bu minimum sayıdan biraz daha fazla ikili basamak kullanarak kodlamak istiyoruz.
Matematiğe, bilime veya mühendisliğe yeni başlayanlar her zaman, problemleri çözmek için mekanik olarak kullanmaları için açık ve evrensel bir yol verilmesini talep ederler. Bu tür yöntemler, yalnızca sorunun çözülebileceğini kanıtlamak için değerlidir ; karmaşık problemler söz konusu olduğunda, genellikle uygulanamaz ve bazen tamamen uygulanamaz hale gelirler. Örneğin, tam kübik denklemin kesin bir çözümü olmasına rağmen, pratikte hiçbirimizin bunu kullanmadığına dikkat edin. Genellikle belirli bir kübik denklem türü veya sınıfı için uygun olan bazı yaklaşık çözüm yöntemlerine başvurulur.
Bilimsel olarak daha sofistike bir kişi, kural olarak, önceden bilinen yöntemlerin mekanik uygulamasından daha iyi bir çözüm bulmaya çalışarak, belirli bir sorunun belirli özelliklerini dikkatlice düşünür. Bu prensibin bilgi teorisinde nasıl kullanıldığını görelim. Bir sembol dizisi oluşturan ayrık bir kaynak durumuyla başlayalım.
Bölüm 5'te , bir kaynağın entropisinin, farklı uzun karakter bloklarının meydana gelmesinin göreli olasılığını inceleyerek hesaplanabileceğini gördük. Blok uzunluğu arttıkça, entropiye yaklaşım giderek daha iyi hale gelir. Çeşitli durumlarda, entropiye iyi bir yaklaşım elde etmek için 5, 10 ve hatta 100 karakterlik bloklar gerekebilir.
Ayrıca mesajı, her birine belirli bir oluşma olasılığı atanabilen ardışık karakter bloklarına bölerek ve bu blokları Huffman yöntemine göre kodlayarak, karakter başına basamak sayısını entropiye yaklaştırmanın mümkün olduğunu da gördük. değer, bloklar uzadıkça.
Bu, verimli kodlama problemini çözmek için kullanılan mekanik şemadır. Neden her durumda onu kullanmıyoruz?
Bunun yapılmamasının nedenlerinden birini anlamak için çok basit bir örneği ele alalım. Bilgi kaynağının rasgele ve eşit olasılıkla bir ikili basamak 1 veya 0 oluşturmasına izin verin ve ardından bir sonraki bağımsız basamağı oluşturmadan önce aynı basamağı iki kez tekrarlayın. Kaynak tarafından oluşturulan mesaj şuna benzer:
00011100011111100 0L 00111.
Böyle bir mesajı sırayla 1, 2, 3, 4, 5 vb . ve sonra bunun iletim için gereken ikili basamak sayısında bir kazançla sonuçlandığını söyleyecektir? bilmiyorum; Ancak bazen bana insan aptallığının sınırı yokmuş gibi geliyor.
Bu durumda verimli iletimin çok daha basit bir şekilde gerçekleştirilebileceği oldukça açıktır. Tekrar nedeniyle, belirli bir mesajın entropisi, yalnızca üçüncü ikili basamaklardan oluşan bir dizinin entropisine eşittir, ancak ikili basamakların rastgele ve bağımsız olarak seçilmesi ve 1 veya 0'ın ortaya çıkma olasılığının eşit olması şartıyla . Başka bir deyişle, 1/ 3'e eşittir bu tür üçlü mesajın her karakteri için bir ikili rakam. Bu mesajı iletmenin en etkili yolu, yalnızca her üç karakterde bir göndermek ve alıcıyı alınan her karakteri üç kez yazması konusunda uyarmaktır.
Bu basit bir örnek ama önemli bir örnek. Kârlı bir şekilde yararlanılabilecek mesajların kaynağının özelliklerinin aranması gerektiğini vurgular.
4'teki İngilizce metin aktarımı tartışması bunu güzel bir şekilde göstermektedir. Örneğin, metni bir televizyon görüntüsü biçiminde iletmek mümkün olacaktır. Bu, karakter başına birçok ikili basamak gerektirir. Böyle bir iletim sistemi, yalnızca İngilizce'yi değil, aynı zamanda Slavca, Yunanca, Sanskritçe, Çince ve diğer herhangi bir metnin yanı sıra manzaraların, fırtınaların, depremlerin resimlerini ve Marilyn Monroe'nun görüntüsünü de iletmeyi mümkün kılacaktır. İngilizce metnin harflerden* oluşması gibi basit ve önemli bir olgudan herhangi bir fayda elde edemeyiz.
İngilizce metni farklı harflerin (ve boşlukların) olasılıklarını hesaba katmadan harf harf kodlarsanız, harf başına 4,75 ikili rakama ihtiyacınız vardır. Morse'un yaptığı gibi, harflerin ortaya çıkma olasılıklarını hesaba katarsak, harf başına 4.14 ikili rakama ihtiyacımız var.
İngilizce metni kodlamanın verimliliğini mekanik olarak geliştirmeye devam ederek, harf çiftlerini, harf üçlülerini vb. Daha büyük İngilizce metin birimi olan kelimeye geçerek kodlamayı geliştirmeye devam etmek daha mantıklı görünüyor . 4. Bölüm , İngilizce metni bu şekilde kodlamanın kelime başına ortalama yaklaşık 14 ikili basamak veya karakter başına 2,5 ikili basamak gerektireceğini gösterdi .
Daha da ileri giderek, bir sonraki mantıklı adım cümle yapısını keşfetmek, yani gramer kurallarından yararlanmak olacaktır. Sorun şu ki, gramer kurallarını bize yardımcı olacak kadar iyi bilmiyoruz ve bilseydik bile, bu kuralları kullanan iletişim sistemi çok karmaşık olurdu. Aslında, pratik bir bakış açısıyla, karakter başına yaklaşık 5 ikili basamak kullanarak İngilizce metnin her harfini bağımsız olarak kodlamak hala en iyisi gibi görünüyor.
İngilizce metnin iletilmesiyle neyin başarılabileceğine dair bir fikir edinmek önemlidir . Bu amaçla , Shannon aşağıdaki durumu değerlendirdi. Varsayalım ki birinden rastgele seçilmiş bir İngilizce metindeki bir sonraki harfi tahmin etmesi için tüm İngilizce bilgisini kullanmasını istedik. Doğru tahmin ederse ona anlatacağız ve o da yazacak. Tahmin edemezse, ona metinde hangi harfin olduğunu söyleyeceğiz ya da doğru harfi söyleyene kadar tahmin etmeye devam etmesini isteyeceğiz.
Şimdi, bu işlemin vericide gerçekleştiğini ve harfleri tahmin etmek için alıcının, sensörün bulunduğu kişiyle aynı hataları yapan tamamen aynı bir çifte sahip olduğunu varsayalım . Ardından, metni iletmek için alıcıdaki kişiyi harfleri tahmin etmeye davet edelim. Vericideki kişi harfi doğru tahmin ederse, alıcıdaki kişi de harfi doğru tahmin edecektir. Yani sadece vericideki kişinin harfi tahmin edemediği durumlarda alıcıdaki kişiye bilgi göndermemiz gerekiyor ve bu bilgi sadece vericideki ve alıcıdaki kişinin bunu yazabilmesi için yeterli olmalıdır. mektup doğru.
Shannon böyle bir iletişim sisteminin bir diyagramını çizdi (Şekil 7.1). Öngörücü ve kaynak metin aşağıdaki gibi etkileşime girer. Bir sonraki tahmin
Resim. 7.1.
harfler gerçek bir harfle karşılaştırılır. Bir hata algılanırsa, bazı bilgiler iletilir. Alıcıda, bir sonraki harf önceden oluşturulmuş metinden tahmin edilir. C • Alınan sinyal yardımıyla karşılaştırma yapılır. Hata yoksa, tahmin edilen harf yazılır, bir hata varsa, kabul edilen “küçültülmüş metin” de yer alan bilgiler kullanılarak düzeltilebilir.
Tabii ki, bu tür ideal ikizler veya diğer yüksek verimli tahmin cihazları mevcut değil. Ancak bu sistem, tamamen mekanik bir prensibe dayalı olsa da daha basit bir görüntü aktarım sisteminde hayata geçirildi. Ancak Shannon'ın hedefi farklıydı. Çiftsiz, tek kişi ile yaparak, yaptığı hataları inceleyerek böyle bir sistemde gerekli transfer oranını oldukça basit bir şekilde bulabilmiştir. Araştırmasının sonuçları Şekil 1'de gösterilmektedir. 5.4 (s. 124). Tahmin, 10 veya 15 harf değil de 100 harf biliniyorsa daha doğrudur. Tahmin hatalarını düzeltmek için sembol başına 0,6 ila 1,3 ikili basamak gereklidir. Bu sonuç şüphe götürmez olduğundan, İngilizce metnin entropisinin harf başına 0,6 ile 1,3 bit arasında olması gerektiği sonucuna varabiliriz .
Ayrık bir bilgi kaynağı araştırma için iyidir, ancak büyük pratik değere sahip değildir çünkü modern telekomünikasyon standartlarına göre İngilizce metni iletmek için çok az sayıda ikili basamak veya açma-kapama darbesi gerekir. Acelemiz olduğunda bile dakikada sadece birkaç yüz kelime konuşuyoruz ve bir telefon kanalı üzerinden dakikada birkaç bin kelimelik metin iletmek kolaydır, bir televizyon kanalı üzerinden 10.000.000 kelime ve prensipte ( gerçi bu pratikte hala imkansız) telefon kanalında dakikada yaklaşık 50.000 kelime ve televizyonda yaklaşık 50.000.000 kelime iletmek mümkün olacaktır.
vizyoner Pratikte, örneğin E harfinin Z harfinden daha hızlı iletilmesine izin veren ustaca Mors kodunu bile her zaman kullanmayız . Teletip kodlarında, sinyal herhangi bir harfi iletirken aynı süreye sahiptir.
Ses iletimi için daha fazla ikili rakam gerektiğinden, verimli kodlama, metin iletimine göre ses iletiminde çok daha önemlidir. Daha da önemlisi televizyonda etkili kodlamadır.
Burada bir kez daha belirtmek isteriz ki, ses veya televizyon görüntüleri, ayrık sinyallerin (metin, sayılar, ikili rakamlar) aksine, doğaları gereği sürekli sinyallerdir. Büyük harfleri ve noktalama işaretlerini göz ardı ederek, İngilizce karakterler alfabedeki herhangi bir harf veya boşluk olabilir. Bir insan sesinin yarattığı ses dalgasının basıncı, belirli bir anda, belirli bir basınç aralığında herhangi bir değer alabilir. Bölüm 4 , böyle bir sinyalin frekansları B bant genişliği ile sınırlanırsa, bu sinyalin saniyede 2 V örnekleme kullanılarak görüntülenebileceğini söyledi .
Bununla birlikte, bir sembolün entropisinin, sembolün kaç değer alabileceğine bağlı olduğunu hatırlayın. Sürekli bir sinyal bir referans noktasında sonsuz sayıda değer alabildiğinden, sürekli bir sinyalin entropisinin örnek başına sonsuz bit sayısına eşit olması gerektiği sonucuna varabiliriz.
Sürekli bir sinyalin kesinlikle doğru bir şekilde yeniden üretilmesi gerekiyorsa, tüm bunlar doğru olacaktır. Ancak, sinyaller duyulmak veya görülmek için iletilir. Ve bunun için yeniden üretimin mutlak sadakati gerekli değildir: yeniden üretimin yalnızca belirli bir dereceye kadar sadakatine sahip olmak yeterlidir. Bu düşüncelerden yola çıkarak, sürekli bir sinyali yansıtan okumaları dikkate alan Shannon, doğruluk (veya güvenilirlik) kriteri kavramını tanıttı . Verilen doğruluk kriterine göre sinyalin tatmin edici bir şekilde çoğaltılması için, numune başına veya saniye başına belirli bir iyi tanımlanmış sonlu sayıda ikili basamak gereklidir. Bu nedenle, verilen doğruluk kriteri tarafından belirlenen doğrulukla, sürekli bir kaynağın entropisinin örnek başına bit veya saniye başına bit cinsinden belirli bir değere sahip olduğunu söyleyebiliriz.
"Doğruluk kriteri" kavramının, tek örneklerle değil, uzun örnek dizileriyle ilişkilendirilmesi gerektiğini anlamak son derece önemlidir. Örneğin, ses iletimi sırasında her örnek %10 daha büyük yapılırsa, ses yalnızca artacak ve ses kalitesi hiç zarar görmeyecektir. Bununla birlikte, her örneğe aynı %10'luk hata eklenirse, ancak rastgele bir yasaya göre değiştirilirse, ortaya çıkan sinyal gürültü nedeniyle çok bozulacaktır. Benzer bir fenomen, bir görüntüyü iletirken meydana gelir: parlaklık veya kontrasttaki bir hata, bir görüntü detayından diğerine sorunsuz ve kademeli olarak geçerse, bu hata fark edilmeden kalır ve aynı büyüklükte, ancak rastgele bir hata, noktadan noktaya keskin bir şekilde değişir. , gözler için dayanılmaz olduğu ortaya çıkıyor.
Sürekli bir sinyalin, her numuneyi kuantize ederek, yani sinyalin yalnızca belirli önceden belirlenmiş değerleri almasına izin vererek iletilebileceğini zaten gördük. Bir görüntünün veya konuşmanın tatmin edici bir şekilde iletilmesi için 128 değerin yeterli olduğu ortaya çıktı . Bununla birlikte, bir konuşma sinyalinin veya bir görüntü sinyalinin her bir örneğini ayrı ayrı niceleyerek, tıpkı metni kelimelerle değil harflerle kodlamanın mantıksız olduğu gibi, oldukça mantıksız davrandığımız anlaşılmalıdır.
Bir seferde birden fazla numunenin nicelemesine hiper niceleme denir . Kesintisiz sinyallerin verimli bir şekilde kodlanması için şüphesiz doğru yol budur. Basit örnek niceleme kullanarak verimli kodlama için umudu tamamen kaybetmek mümkündür. Bununla birlikte, sürekli bir sinyalin etkili hiper nicelemesini gerçekleştirmek kolay değildir ve şu anda genellikle bağımsız örnek niceleme yöntemleri kullanılmaktadır. Bu yöntemlerden biri de bazı askeri telefon haberleşme sistemlerinde kullanılan darbe kod modülasyonudur. Telefon sinyallerinin çok kanallı iletimi ile ilgili olarak, yani aynı iletişim kanalı üzerinden çok sayıda konuşma sinyalinin iletimi için darbe kodu modülasyon yöntemleri de geliştirilmektedir.
PCM'de, her örneğe önceden belirlenmiş bir dizi seviyeden en yakın olanı atanır. Örnek olarak, eşit aralıklı 8 seviye alalım (Şekil 7.2 i a). Okumayı temsil eden seviye iletilir
Фиг. 7.2
по
101
IOO Sıfır
011' seviyesi
OIO
OOl
ООО
sonra bu seviyenin sağına yazılan ikili sayıyı kullanarak. Ancak bu iletim yöntemiyle bile biraz hile yapabilirsiniz. Eşit aralıklı seviyeler yerine, Şekil 2'de gösterildiği gibi, küçük sinyaller için daha yakın niceleme seviyeleri kullanılabilir ve büyük sinyaller için seviyeler arasındaki mesafe arttırılabilir. 7.2.6. Bunun nedeni, bir kulağın, ortalama basınç seviyesinin bu kadar çok bar üzerinde veya altında ölçülen veya artı veya eksi olarak ölçülen sinyaldeki hataya göre hatanın a sinyalinin genliğine oranının büyüklüğüne daha duyarlı olmasıdır. çok volt.. Benzer sıkıştırma uygulamak [ör. e. vericideki büyük sinyalleri sıkıştırma (sıkıştırma) ve genişletme (genişleterek) alıcıda], örnek başına 7 ikili hanenin , iletilen sinyal seviyeleri eşit mesafedeyse 11 ikili hanenin vereceği sinyal kadar iyi bir sinyal vermesini sağlamak mümkündür .
Daha iyi konuşma iletimi için, insan konuşmasının ve işitmesinin karakteristik özelliklerini incelemek gerekir.
(o)
(3)
⅜⅜ , ∖ ' λv _
(onun) (f)
δ e
w olarak
Resim. 7.3.
Sonuçta, dinleyicinin aktarımı yeterince iyi bulması için, çok yüksek aktarım doğruluğuna gerek yoktur.
Yalnızca ses dalga formu analizine dayalı olarak konuşmayı verimli bir şekilde kodlamak için birçok girişimde bulunulmuştur. Ama pek bir etki yaratmadı. Ses titreşimlerinin sayıdan sayıya önemsiz bir şekilde değiştiğini görmek kolaydır. Bu nedenle, örneklerin kendilerini iletmek yerine, birbirini izleyen iki örnek arasındaki farkın iletilmesi önerildi.
Resimde. 7.3, birkaç konuşma sesinin titreşim biçimini, yani ses basıncındaki veya voltajdaki değişikliğin zaman içinde gösterilmesini gösterir. Bu titreşimlerin birçoğunun, özellikle sesli harflere karşılık gelenlerin (Şekil 7.3, a ־ - d) çok iyi bir doğrulukla tekrarlanır. Ancak sadece bir periyodu aktarıp sonraki periyotlar yerine onu tekrarlamak mümkün müdür? Bu çok zordur, çünkü gerçek bir konuşma süresinin uzunluğunu doğru bir şekilde belirleyen bir cihaz çok, çok karmaşık olmalıdır. Bununla birlikte, böyle bir cihaz yaratma girişimleri yapıldı. Konuşma anlaşılırdı, ancak büyük çarpıtmalarla.
Etkili konuşma kodlaması açıkça daha kapsamlı bir yaklaşım gerektirir: İhtiyaç duyulan farklı konuşma seslerinin sayısının ne kadar fazla olduğunu bulmak gerekir. iletmenin yanı sıra işitme organlarımızın bu sesleri ne kadar etkili bir şekilde ayırt edebildiğini de.
Ses basıncındaki, yani ses titreşimlerindeki değişim sıklığı çok yüksek olmasına rağmen (saniyede birkaç bin mertebesinde), sesimizi çok daha yavaş kontrol ederiz. Yapabileceğimiz maksimum şey, sesin doğasını saniyede birkaç on kez değiştirmektir. Bu nedenle, konuşma, konuşma seslerinin titreşim frekanslarını analiz ederek varılabilecek sonuca göre daha basit görünmektedir (ve aslında öyledir).
Konuşma organlarımızı nasıl yönetiriz? Öncelikle ses telleri yardımıyla sesli seslerin oluşumunu kontrol ediyoruz. Ses telleri gırtlağa yapışık iki katlı dokudur . Herhangi bir ses çıkarmadığımız zaman, ses telleri genişçe ayrılır. Akciğerlerden gelen havanın ses tellerinden geçerek ses üretebilmesi için, ses tellerinin neredeyse tamamen temas edecek şekilde hareket ettirilmesi gerekir. Ses telleri yakınlaştırılırsa ses çok yüksek, birbirinden uzaklaştırılırsa ses azalır.
Ses tellerinin oluşturduğu ses titreşimleri birçok frekans bileşeni içerir. Ağız ve dudaklar, belirli frekansları diğerlerinden daha fazla vurgulayan karmaşık bir rezonatördür. Hangi frekans bileşenlerinin vurgulandığı dil, yumuşak damak, gırtlak ve dudakların konumuna bağlıdır.
Ünlüler gibi bazı konuşma sesleri ve [t] ve [r] gibi sesli sesler, dudakların farklı konumlarındaki ses telleri tarafından üretilir.
Patlayıcı ünsüzler [p, b, g, t], dudaklar veya dil aniden konuşma aparatından hava yolunu açtığında oluşturulur. Bazı sesleri oluştururken (örneğin, [b]), ses telleri yer alır, ancak diğerlerini oluştururken (örneğin, [p]) katılmazlar.
Hava çeşitli engellerden (dil, dudak vb.) geçerken [s] ve [sh] gibi frikatif (tıslama) sesler oluşur. Bazen ses telleri de işin içine girer (örneğin masmavi kelimesindeki [zh] sesi ).
Konuşma organlarının hareketi, oluşturdukları ses titreşimlerinden çok daha yavaştır. Etkili konuşma kodlamanın anahtarı bu olamaz mı?
30'ların başlarında, Shannon'ın bilgi teorisi üzerine çalışmasından çok önce, Bell Telephone Laboratories'den Homer Dudley, konuşma iletmek için ses kodlayıcı (ses kodlayıcı - ses kodlamasından) adını verdiği bir cihaz icat etti . Ses kodlayıcının vericisi (analizör) ve alıcısı (sentezleyici) ŞEK. 7.4.
Analizörde, konuşma seslerinin tam bir elektriksel kopyası , her biri kendi frekans bandındaki sinyal seviyesini belirleyen ve bu seviyeye karşılık gelen bir sinyali sentezleyiciye ileten 16 filtreye beslenir. Ayrıca sesin sağır mı (fsj, [f)) yoksa sesli mi ([o], [i]) olduğu analiz edilir ve sonraki durumda yüksekliği belirlenir.
Ses sağır ise, sentezleyicide bir tıslama oluşturulur ve sesli ise, konuşmacının ses tellerinden geçen havanın titreşim frekansına denk gelen bir frekansta bir dizi elektriksel uyarı oluşturulur.
Resim. 7.4.
Hiss veya darbeler, her biri benzer bir analizör filtresine karşılık gelen bir bant genişliğinden geçen bir dizi filtreye uygulanır. Sentezleyicideki her bir filtrenin geçiş seviyesi, iletilen konuşma sesindeki bu frekansların varlığına göre analizördeki ilgili filtreden gelen sinyal tarafından kontrol edilir.
Bu iletim yöntemi anlaşılır konuşma üretir. Temel olarak, analizci konuşmayı dinler ve analiz eder ve ardından sentezleyiciye - konuşan makineye - konuşulan kelimeleri aynı perde ve tonlama ile nasıl yeniden üreteceğini söyler.
Çoğu ses kodlayıcının güçlü ve nahoş bir "elektrik" aksanı vardır. Bu fenomenin nedenlerinin incelenmesi, konuşma kalitesini neyin etkilediğine dair yeni ve önemli sonuçlara yol açmıştır. Bu konu üzerinde durup ayrıntılara girecek vaktimiz yok. Sadece kusurlu bir ses kodlayıcının bile çok faydalı olabileceğini not ediyoruz. Bu nedenle, bazen şifreli konuşma iletimine başvurmak gerekir. Darbe kodu modülasyonu kullanarak konuşmayı ikili basamaklarla değiştirmeye çalışırsanız, iletmek için saniyede 30.000 ila 60.000 ikili basamak gerekir . Bir ses kodlayıcı kullanırken, konuşma saniyede 1500 bit hızında iletilebilir .
7.4'te gösterilen örnekte , bunlardan 16 tanesi vardır ). Aslında, ses seslerinin enerjisinin ana kısmı yalnızca birkaç frekans aralığında yoğunlaşmıştır. Bu aralıklara formant denir . Ses yolunun rezonans frekanslarına karşılık gelirler. Sadece iki veya üç formantın konumu ve yoğunluğu hakkında bilgi ileterek anlaşılır konuşma elde etmek mümkündür. Böyle bir biçimlendirici ses kodlayıcı , konuşmayı iletmek için kullanılabilir ve bir kanal ses kodlayıcı kullanmaya kıyasla saniyede önemli ölçüde daha az ikili basamak gerektirir (bkz. Şekil 7.4). Fonem ses kodlayıcıları adı verilen daha ekonomik ancak daha az anlaşılır ses kodlayıcılarda , ayrıştırıcı ses birimi adı verilen birkaç temel konuşma sesini bilir ve bunların sentezleyicide nasıl çalınacağını kontrol eder.
Ses kodlayıcının performansı, telefon iletişiminin gereksinimlerini karşılamıyor. Kanal ses kodlayıcısının doğal olmayan sesi, görünüşe göre sesli seslerden sağır seslere yanlış geçişten, perdenin yeterince doğru şekilde yeniden üretilmesinden ve ayrıca sentezleyicinin ses üreteci tarafından ses yolunun diğer özelliklerinden kaynaklanmaktadır. Bir sentezleyici için daha iyi bir ses kaynağı, konuşma spektrumundan birkaç yüz hertzlik bir bantta kesilmiş bir sinyal olabilir. Böyle bir sesle uyarılan vocoder, ses kalitesi olarak geleneksel bir telefona karşılık gelirken, bu tür bir vocoder'ın çıktısı, bir telefon kanalının çıktısının yarısından fazla değildir. Ses kodlayıcıların yüksek maliyeti, yaygın kullanımlarını sağlar; sadece transatlantik telefon iletişimleri için kullanılabilirler.
Onu bırakmadan önce ses kodlayıcı hakkında biraz daha konuşalım.
En ekonomik ses kodlayıcılarla bile ses iletiminin, yazılı metinden çok daha fazla ikili basamak gerektirdiğini unutmayın. Bunun nedeni kısmen konuşma analizi ve kodlamanın basılı karakterlerin analizi ve kodlamasına kıyasla teknik zorluklarından ve kısmen de konuşma iletilirken genellikle metinde yer alan bilgilere ek olarak aslında konuşmacının diksiyonu, tınısı, vurgusu ve tonlaması hakkında bilgi aktarır. Başka bir deyişle, konuşulan kelime başına entropi, yazılı kelime başına entropiden daha büyüktür.
Ses kodlayıcı ile konuşmanın diğer yöntemlere göre daha verimli kodlanması, konuşma aparatımızın ürettiği salınımların frekanslarından çok daha düşük frekanslarda çalışmasından kaynaklanmaktadır. Ses kodlayıcının etkinliği aynı zamanda işitme kapasitemizin sınırlı olmasından da kaynaklanmaktadır.
açısından , en karmaşık konuşma sesleri tıslama (sürtünme) sesleridir, örneğin [sh] (Şekil 7.3,¢) ve [s] (Şekil 7.3, ש/ע ). Ayrıca, art arda telaffuz edilen iki [s]' ye karşılık gelen titreşimler, biçim olarak biraz farklı olabilir. Ve bunların her birini tüm ayrıntılarıyla iletmek için saniyede çok sayıda ikili basamak gerekir. Ve kulak tarafından, yaklaşık olarak aynı frekans spektrumlarına sahiplerse, ilk ses [s] ikinciye benzer. Bu nedenle, ses kodlayıcının konuşulan sesi [s] tam olarak yeniden üretmesi mutlak olarak gerekli değildir ; bu sesin doğru algılanması için frekans spektrumunun yaklaşık olarak yeniden üretilmesi yeterlidir.
Konuşma iletiminde verimli bir şekilde kodlamanın en iyi yolunun, bazı basit karakteristik konuşma seslerini izole etmek ve onları alıcı tarafta yeniden yaratmak gibi göründüğünü görüyoruz. Televizyon daha fazla bant genişliği gerektirdiğinden, televizyonda verimli kodlama telefondan bile daha önemlidir. Peki benzer ilkeleri televizyonda uygulamak mümkün müdür?
Bir televizyon görüntüsünü iletmek, konuşmayı iletmekten çok daha zordur. Bu kısmen görme organlarının işitme organlarından daha yüksek çözünürlüğünden kaynaklanmaktadır. Bu kısmen, konuşmanın her zaman yaklaşık olarak aynı konuşma organları tarafından yaratılmasına rağmen, televizyonun birçok kaynaktan çeşitli görüntüler yayınlamasından kaynaklanmaktadır.
Bu şu soruyu akla getiriyor: Tüm bu özellikleri hesaba katarak ve kendimizi bir tür olası görüntüyle, örneğin bir insan yüzüyle sınırlayarak, görüntüleri iletmek için ses kodlayıcı benzeri bir cihaz oluşturmak mümkün mü?
Böyle bir cihaz oldukça düşünülebilir. Alıcı tarafta bir insan yüzünün kauçuk bir modeline veya devasa bir elektronik bilgisayarın depolama aygıtında böyle bir modelin açıklamasına sahip olduğumuzu varsayalım. İlk olarak, verici, iletilecek yüzü "düşünmeli" ve modeli alıcıya şekil ve renk olarak "uydurmalıdır". Ayrıca verici, ışık kaynaklarının konumunu ve parlaklığını belirlemeli ve bu verileri alıcıya iletmelidir. Verici cihazın önünde duran bir kişi konuşursa, verici onun gözlerinin, dudaklarının, çenelerinin ve yüz kaslarının hareketini takip etmeli ve modelin bu hareketleri alıcı tarafta doğru bir şekilde yeniden üretmesi için tüm bunları iletmelidir. Böyle bir yöntem çok verimli olabilir ve birileri listelediğim tüm işlemleri gerçekleştirmek için mantıklı bir yöntem önerirse kullanılabilir. Ama ne yazık ki! Ne yapılması gerektiğini söylemek, yapmaktan daha kolaydır (birisi, diyelim ki, Beethoven'ın onuncu senfonisini yazmaya çalışsın veya belirli bir konuda bir başyapıt yazsın).
Bilim ve teknolojinin sınırsız olanaklara sahip olduğu bu günlerde, insanoğlunun gerçekleştirilemez arzuları o kadar önemli hale geldi ki, Amerikan basınında çok popüler olan özel bir kelime bile bu fantezileri belirtmek için icat edildi. Bu kelime çığır açıcıdır. (atılım). Biraz daha az sıklıkta, bu kelime zaten başarılmış bir şeyi ifade etmek için kullanılır.
Bu fantaziden sıyrılırsak, mevcut tüm görüntü aktarım sistemlerinin tek bir genel ilkeye dayandığını fark ederiz. Ardışık noktaların parlaklığını belirlemek için orijinal görüntü genişletilir veya taranır. Tarama, yakın aralıklı çizgiler veya çizgiler boyunca gerçekleştirilir. Renkli televizyonda, farklı renklerde üç görüntü aynı anda konuşlandırılır. Ve sonra parlaklığı vericiden gelen sinyallere göre değişen parlak bir nokta, alıcıda vericideki ile aynı hatlar boyunca hareket eden bir görüntü oluşturur. Şimdiye kadar, verimli kodlamayı pratik olarak uygulamaya yönelik tüm girişimler, görüntünün açılmasının bir sonucu olarak üretilen sinyal temelinde gerçekleştirilmiştir.
Renkli televizyonda son derece verimli bir kodlama yöntemi kullanılmaktadır. Renkli bir görüntünün parlaklığı çok ince ayrıntılarda değişir; renk çok daha az ayrıntılıdır. Bu sayede renkli bir görüntü aynı iletişim kanalı üzerinden siyah beyaz (monokromatik) ile aynı detayda iletilebilir. Tabii ki, bu durumda, renkli televizyon bir analog sinyal kullanır, yani görüntü, açma-kapama tipinde ayrı darbelere dönüşmez.
Siyah beyaz bir televizyon görüntüsünün verimli bir şekilde kodlanması için aşağıdaki yöntem önerilmiştir: yalnızca yavaş sinyal değişiklikleri yüksek doğrulukla iletilir ve hızlı değişiklikler ya daha az doğru olarak ya da yalnızca meydana geldikleri anda iletilir. Bunun ne kadar etkili olduğu konusunda çok fazla tartışma var.
Televizyonda titremeyi önlemek için her 1/3 saniyede bir çerçeve iletilir . Sinemada çerçeveler her 1/24 saniyede bir değişir , ancak titremeyi önlemek için ışık akısı
A
her kare obtüratör tarafından birkaç kez kesilir. Pek çok nesne, örneğin birçok yüz varsa , görüntüyü birkaç kez tekrarlayarak titreme önlenebilir, bunun için kareleri her 1/10'da bir değiştirmek yeterlidir. saniye Ancak bu, alıcıda Tam Görüntüye karşılık gelen sinyali depolayacak bir bellek cihazı gerektirecektir. Şimdi böyle bir cihaz görünüşe göre çok pahalı, ancak bu yöntem saniyede gerekli ikili basamak sayısını üç kat azaltacaktır.
Video sinyalinin (görüntü sinyali) voltajının, Şekil 2'de gösterildiği gibi zamanla değiştiğini varsayalım. 7.5, bir. Ayrıca, bu sinyali görüntülemek için oldukça fazla sayıda numunenin gerekli olduğu da burada gösterilmiştir. Bunun yerine bu sinyale düz çizgilerle yaklaşılabilir mi (bkz. Şekil 7.5b )? Bu, yalnızca düz çizgilerin sonunda iletilecek sinyalin büyüklüğüne izin verecektir (h i - h Q ) ve bu değerler arasındaki mesafe (Z 1 — Z 5 ). Bu fikir yeni değil. Hatta son zamanlarda uygulamaya konulmaya çalışılmıştır ancak bu yöntemin ne kadar etkili olduğu henüz netlik kazanmamıştır.
yakın niceleme seviyelerini seçmesinin ve büyük sinyaller için buna karşılık olarak daha fazla aralıklı seviyeleri seçmesinin daha avantajlı olduğunu hatırlayın . Ancak bir görüntüyü aktarırken, bu yöntem verimsizdir, çünkü görüntünün hem açık hem de karanlık kısımlarında küçük ayrıntılar (saç veya malzeme dokusu) görünebilir, yani yüksek veya düşük sinyal seviyesine karşılık gelir. Bununla birlikte, parlaklıktaki büyük değişiklikleri küçük değişikliklerle aynı doğrulukla yeniden üretmeye gerek olmadığı açıktır. Böylece, birbirini izleyen iki numunenin değerlerindeki farkı ileterek, küçük değişiklikler için (örneğin, bir saç görüntüsünü iletirken) küçük bir niceleme adımı ve büyük değişiklikler için daha büyük bir adım kullanabilir ve aynı tasarrufları elde edebilirsiniz. konuşma iletirken. Bu yöntemin geliştirilmiş bir versiyonunu kullanarak (gönderilen numune ile alınan numune arasındaki farkı yukarıdaki noktada mı yoksa verilen noktanın solunda mı aktaracağınızı seçebilirsiniz), numune başına üç hane ile iletmek mümkündür her örneğin seviyesi ayrı ayrı kodlanır ve gönderilirse, örnek başına yedi basamakla hemen hemen aynıdır. *
Söylenenleri özetlersek, verimli kodlamanın dayandığı üç ilke olduğunu görüyoruz:
Sinyal örneklerini veya sembolleri tek tek kodlamayın, tüm sinyal dizilerini bir kerede kodlayın (hiper niceleme).
Sinyal kaynağına konulan kısıtlamalara dikkat edin.
Sinyal iletimindeki bazı hatalara gözümüzün ve kulağımızın duyarsız olduğunu unutmayın.
Bu ilkeler, ses kodlayıcı tarafından güzel bir şekilde gösterilmektedir. Konuşma sinyalinin incelikli, hızla değişen yapısını analiz etmez. Yalnızca belirli frekans aralıklarındaki toplam enerji hakkında bilgi ve konuşan, sağır veya çınlayan konuşma seslerini ileten bir sinyal iletirler. Bu yöntem çok etkilidir çünkü konuşma organları konumlarını hızla değiştiremez. Alıcı tarafta, ses kodlayıcı, orijinaliyle tam olarak eşleşmeyen konuşmayı yeniden üretir, ancak işitme özelliklerimiz nedeniyle doğru olarak algılanır.
Ses kodlayıcı, verimli mesaj iletimi açısından mükemmelliğin özüdür. Bir sonraki en verimli muhtemelen, görüntünün renginin parlaklıktaki değişikliklerden daha az doğru bir şekilde yeniden üretildiği renkli televizyondur. Bu, gözlerimizin küçük renkli ayrıntıları ayırt edememesinden yararlanır.
Bununla birlikte, şu anda, uzun sinyal dizilerinin kodlamasını kullanmayan ve bu nedenle bilgi teorisinin ışığında yeterince etkili olmayan bu tür iletişim araçlarının kullanılması gerektiğine dikkat edin.
Bununla birlikte, verimli kodlama teknikleri büyük bir potansiyel değere sahiptir. Transatlantik telefon kablosu gibi çok pahalı iletişim kanalları üzerinden nispeten geniş bant sinyallerinin (televizyon ve hatta ses) iletilmesi durumunda özellikle önemlidirler.
Hiç şüphesiz, gelecekte kodlamanın verimliliğini artırmak için çok fazla ustalık ve ustalık gerekecektir ve elbette harika sonuçlar elde edilecektir. Ama belki de kendinden çok uzaklaşmamalısın.
Örneğin, İngilizce metin yazdığımızı varsayalım. Birkaç mektubu iletirken bir hata yaparsak, o zaman bu metnin anlamını hala yakalayabiliriz : (Burada bazı ünlülere yan sesli o diye seslendim.)
Hatta ünlüleri x harfiyle değiştirebilir ve şu seçeneği elde edebilirsiniz: -Hxrx x hxvx rxplxcxd thx vxwxlx bx x. (Zdhs X zkhmkhnkhl nkhkhtkhrkhkh glhenkhkh bkhkvhy x.)
Kelime kelime kodlama daha etkilidir. Bununla birlikte, bir yazım hatası tespit etmek imkansızdır, çünkü bir kelimenin yerine başka bir kelime geçmektedir. Ve bazen bu istenmeyen sonuçlara yol açabilir.
Sözcük uygunsuzsa yine de bir hata tespit edebiliriz. Bununla birlikte, gramer açısından doğru metni veren daha gelişmiş bir cihaz kullanırsak, iletim sırasında ortaya çıkan hataları fark etme şansımız neredeyse hiç yoktur.
İngilizce metin, diğer birçok mesaj kaynağı gibi, muhatabın hataları tespit etmesine izin veren fazlalığa sahiptir. Yanlış iletilen birkaç harf (bir harfi diğeriyle değiştirmek), doğru iletilen harflere göre düzeltilebildikleri için tüm mesajı bozamaz. Aslında, el yazımın şifresi ancak metnin fazlalığı sayesinde çözülebiliyor. Ses iletiminde sürekli bir sinyalden örnekler alındığında, örneğin değerindeki ofsetler tıklamalara ve televizyonda görüntüde beneklere neden olur .
Şimdiye kadar, yalnızca orijinal mesajı yeniden oluşturmamıza izin veren mutlak minimum bilgiyi iletmek için fazlalığı tamamen ortadan kaldırmaya çalıştık. Ancak gördüğümüz gibi, bu fazlalık kaldırma işlemi yeterince başarılı bir şekilde gerçekleştirilirse, mesajın iletilmesindeki herhangi bir hata, mesajın anlamını bozar veya değiştirir. İletimde en ufak bir hata yaparsak, o zaman hata güçlü bozulmalara yol açabilir.
Elektrikli iletişim araçlarında her zaman bir tür gürültü olduğunu hepimiz biliyoruz - radyoda bir tıslama, televizyonda "kar". Doğanın bir kanunu olarak gürültünün varlığı kaçınılmazdır. Bu, kaynağın mesajını, kaynağın entropisinden yalnızca biraz daha fazla ikili basamak kullanarak kodlamak olan ana hedefimizi etkileyemez mi?
Bir sonraki bölümde ele alacağımız soru bu.
Sekizinci Bölüm
GÜRÜLTÜLÜ
KANAL
_
Dünyayı başkalarının gözünden görmek zordur ve özellikle kendini geçmişte kalmış bir adamın yerine koymak zordur. Kraliçe Victoria döneminde yaşayanlar modern elbiseler hakkında ne düşünürdü? Görelilik kuramı Einstein'ın çağdaşları için ne kadar şaşırtıcıydıysa, Newton'un mekanik yasaları da çağdaşları için o kadar şaşırtıcı mıydı? Ve genel olarak, görelilik teorisinde şaşırtıcı olan nedir? Bugünün öğrencisi, görelilik teorisini sadece boyun eğmiş bir şekilde değil, aynı zamanda bir tür kaçınılmazlık duygusuyla, sanki başka herhangi bir teori garip, şaşırtıcı ve açıklanamazmış gibi algılıyor.
Bunun nedeni kısmen görüşlerimizin zamanımızı ve çevremizi yansıtması ve kısmen de (en azından bilimde) teorilerin yeni veya daha iyi formüle edilmiş sorulara yanıtlar olarak ortaya çıkmasıdır. Platon'a göre, Sokrates'in kesin bir soru dizisi kullanarak geometrik ispatlar türettiğini hatırlayın. Kendilerine kesin sorular sormayanların doğru cevapları alması pek olası değildir, ancak soru net bir şekilde formüle edilirse cevap aşikar hale gelir.
İletişime dahil olanlar için en başından beri י idi. İdeal iletişim kanallarının olmadığı açıktır. Telefonda ve radyoda, hem zayıf hem de güçlü olabilen ve şimşek deşarjlarının karakteristik tıklamalarından sabit, sabit bir ıslık veya tıslamaya kadar değişebilen bir parazit arka planına karşı faydalı bir sinyal duyarız. Ve bir TV sinyali alırken, görüntü "kar" taneleri ile kaplanabilir. Bir teletipte bile parazit nedeniyle iletilen yanlış mektubu almak mümkündür.
Diyelim ki birisi 1945'te bir iletişim mühendisine gürültü sorununu sordu. "Gürültüden nasıl kurtulacağını söylüyorlar?" İşaretçi daha sonra şöyle derdi: "Verici gücünü artırabilir veya alıcı gürültüsünü azaltabilir ve alıcınızın, yararlı sinyallerin olmadığı frekanslardaki paraziti almasını engellemeye çalışabilirsiniz."
Ancak soruyu soran ısrarcı olabilir: "Başka bir şey yapamaz mıyız?" Mühendis, “Pekala, frekans modülasyonunu deneyin; çok geniş bir frekans bandı ile çalışarak gürültünün etkisini azaltmak mümkün.”
Bununla birlikte, şu sorunun da sorulduğunu varsayalım: "Ya parazit nedeniyle teletip yanlış mektubu alırsa?" İşaretçi büyük olasılıkla şu şekilde cevap verebilir: "Ondalık basamaklardan birini iletmek için açma-kapama tipinde beş darbe alırsanız ve yalnızca iki açık darbe ve üç kapalı darbe içeren kodları seçerseniz, o zaman siz bu kodun iletimindeki hataları fark edebilir, bu da iki değil, az ya da çok sayıda anahtarlama darbesinin alınmasına yol açacaktır.
Ardından soruyu soran kişi devam ediyor: "Teletipin kendisi hata yapıyorsa, doğru mesajları iletmenin herhangi bir yolu var mı?" İşaretçi bu soruya ancak şu yanıtı verebildi: “Mesajı yeterince tekrarlarsan sanırım olur ama bu korkunç bir israf. Teletype'ı düzeltsen iyi olur."
Burada, Shannon'dan önce kimsenin sormadığı bir soruya yaklaşıyoruz. Meraklımızın şöyle dediğini varsayalım: “Mesajımı uygun şekilde kodladıktan sonra, onu gürültülü bir kanaldan bile iletebileceğimi ve hata sayısının ihmal edilebilir, verilen herhangi bir değerden daha az olacağını söylediğimi varsayalım. Diyelim ki, iletişim kanalım için gürültünün türü ve büyüklüğü biliniyorsa, o zaman kanaldan saniyede kaç harfin iletilebileceğini hesaplayabilirim. Daha az iletirsem, pratikte hiç hata olmaz, ancak daha fazla iletmeye çalışırsam, kaçınılmaz olarak hatalar ortaya çıkacaktır.
İşaretçi cevap vermek zorunda kalacaktı: "Bunu nasıl yapacağımı bana söyler misiniz? Hiç böyle bir şey duymadım ve söyledikleriniz kesinlikle inanılmaz geliyor. Sonuçta, artan gürültü ile hata sayısı her zaman artar. Elbette mesajı birkaç kez tekrarlarsanız, hata sayısı çok fazla olmamak kaydıyla işler düzelecektir. Ama her zaman çok pahalıdır. Belki sözlerinde bir şeyler gizlidir ama eğer öyleyse çok şaşırırım. Ama hala...".
Ama o zamanlar karanlıkta dolaşan mühendisler hakkında ne düşündüğümüz önemli değil; Bu geçiş dönemini yaşayan tüm matematikçiler ve mühendisler, Shannon'ın gürültülü bir kanal üzerinden bilgi iletmek için elde ettiği sonuçlara şaşırdılar ve hala şaşırmaya devam ediyorlar. Ama Shannon'ın çalışmasında özel bir şey görmeyen eğitimli bir amatör tanıyorum. Tüm bunlarla nasıl ilişki kurmalıyız?
Belki de en iyisi mesajlaşma problemini gürültü varlığında şimdi anladığımız şekliyle basitçe tanımlamak ve açıklamaktır. Bunu yapmak için, şu anda bize ne kadar kaçınılmaz ve doğal görünseler de içeriği ve yönü Shannon sonrası döneme ilişkin sorular soracağız. Ve biz onların üzerinde olacağız
cevap!m'de bariz görünseler bile. Ve okuyucu istediği gibi şaşırsın ya da olmasın.
Şimdiye kadar, verimli iletim için metin ve sayıları kodlamanın hem en basit hem de daha karmaşık yöntemlerini ele aldık. W bant genişliğine sahip herhangi bir elektrik sinyalinin 2W görüntülenebilir 1 12W boyunca alınan saniye başına sayım saniye. PCM kullanarak, yaklaşık 7 ikili basamak kullanarak, her numunenin genliğini doğru bir şekilde görüntülemenin mümkün olduğunu gördük . Bu nedenle, darbe kodu modülasyonu veya daha karmaşık ve verimli başka bir yöntem kullanılarak, konuşmayı veya bir görüntüyü bir ikili basamak dizisi (açma-kapama tipi veya artı-eksi tipi akım darbeleri) olarak iletmek mümkündür.
Ancak, iletilen sinyalin aynısı alıcı uçta alındığı sürece, bunların hepsi iyidir. Aslında durum böyle değil. Bazen 1'in olduğu yerde O alırız ve bunun tersi de geçerlidir. Bu, düşük hızlı telgraf cihazlarında röle arızaları veya yüksek hızlı telgraf cihazlarında lamba ve transistör arızaları sonucu olabilir. Bu aynı zamanda diğer sinyallerin, ekipman gürültüsünün, manyetik fırtınaların vb. neden olduğu parazit nedeniyle de olabilir.
Basit bir örnek kullanarak, parazit göründüğünde hataların nasıl oluştuğunu ele alalım. Elektrik sinyallerini kullanarak çok sayıda sıfır ve birleri tel üzerinden iletmek istediğimizi varsayalım. İkili basamak dizisi $ (Şekil 8.1), voltaj darbeleri +1 veya -1 örnekleriyle görüntülenebilir . ŞEK. 8.1 gerilim dizisi, 101110010 ikili basamak dizisine karşılık gelir .
Şimdi, sinyale hem pozitif hem de negatif değerler alabilen rastgele gürültünün eklendiğini varsayalım. Bu gürültü, yararlı sinyalin okumalarıyla aynı zaman anlarında alınan bir dizi gürültü okuması 7r aracılığıyla temsil edilebilir (bkz. Şekil 8.1). Alıcı uçta, sinyal ve gürültü örneklerinin eklenmesiyle elde edilen toplam $ + 7r dizisini elde ederiz.
Şimdi kabul edilen pozitif voltaj değerlerini birim olarak, negatif değerleri ise sıfır olarak kabul edersek, 176
г 110
Ошибки X X
Разряды 1 2 3
110 110
X
4 5 6 7 8 9
ve d.8.1 .
o zaman alınan mesaj sayılarla temsil edilecektir (Şekil 8.1'de r ). Gördüğünüz gibi 2, 3 ve 7 numaralı örneklerde hatalar var .
Alım sırasında bu tür hataların ortaya çıkmasının etkisi, sinir bozucudan felakete kadar farklı olabilir. Basit kodlama teknikleri kullanılarak konuşma veya görüntüleri iletirken, hatalar tıklama, tıslama, tıslama veya "kar" ile sonuçlanır. Blok kodlama (hiper niceleme) gibi daha gelişmiş yöntemler kullanıldığında, hatalar daha belirgin olacaktır. Metin iletirken daha da tehlikeli hatalar beklenebilir.
Metni geleneksel yöntemlerle iletirken, hatalar yalnızca yazım hatalarına yol açar. Genellikle metin o kadar gereksizdir ki, onları anında algılarız. Ancak, örneğin ülkenin farklı yerlerinde gazete ve dergilerin aynı anda basılmasında olduğu gibi, matbaa vericiden uzakta bulunuyorsa, bu tür hatalar oldukça pahalıya mal olabilir.
12
Дж. Пирс
177
En tehlikeli hatalar sayı verirken yapılır. Bir hata 1.000 doları 9.000 dolara çevirebilir.Elektronik bir hesap makinesinde karmaşık hesaplamalar yapmak için tasarlanmış bir programda bir hata oluşursa, o zaman tek bir hata tüm hesaplamaları anlamsız hale getirebilir.
Bir İngilizce metin veya başka bir sinyal yeterince verimli bir şekilde kodlanırsa (yani fazlalık ortadan kaldırılırsa), o zaman tek bir hatanın alınan sinyalin anlamında tam bir değişikliğe yol açabileceğini zaten söylemiştik.
Ancak hatalar çok tehlikeli olduğuna göre, onlarla nasıl başa çıkılır? Olası bir yol, her harfi iki kez göndermek veya bir harf veya sayıyı temsil etmek için kullanılan her ikili rakamı iki kez göndermektir. 101001101 ikili dizisini iletirken , aşağıdakiler gönderilebilir ve alınabilir:
aktarıldı 110011000011110011
kabul edildi 110011000111110011
s X
hata
Sabit bir bit hızıyla, bu yöntem veri aktarım hızını yarıya indirir, çünkü her basamağı durdurup yeniden iletmemiz gerekir. Ancak şimdi alınan sinyalin kendisi zaten hatanın yapıldığı yeri tespit etmeye yardımcı oluyor, çünkü 0 0 ve 1 1 sayı çiftlerine ek olarak 1 0 çiftlerini de alacağız . Ancak, orijinal çiftin ne olduğu bilinmiyor. 1 1 veya 0 0 idi . Bir hata bulduk ama düzeltmedik .
Hatalar çok sık görünmüyorsa ve ardışık üç basamakta iki hata alma olasılığı ihmal edilebilir düzeydeyse, bulunan hata her basamak üç kez geçirilerek düzeltilebilir, diyelim ki:
aktarıldı 111000111000000111111
kabul edildi
×
hata
Burada, durup her basamağı iki kez daha tekrarlamak zorunda kaldığımız için baud hızımızı üç kat azalttık. Ancak şimdi, belirtilen 101 basamaklı grubun hepsinin aynı olmadığını gördükten sonra, hata düzeltilebilir. Bu grubun iletiminde sadece bir hata oluştuğunu varsayarsak, bu grup OOO değil 111 olmalı ve ortalama 0 değil 1 olmalıdır.
Bu basit yöntemin - aktarılan rakamların tekrarı - yeterince nadir olmaları durumunda hataları tespit etmemize ve hatta düzeltmemize izin verdiğini görüyoruz. Ama ne pahasına olursa olsun! Hataları düzeltmek ve tespit etmek için bu yöntemi kullanırsanız, o zaman neredeyse tüm rakamlar doğru bir şekilde iletilse bile, sadece hatayı tespit etmek için iletim hızını yarıya indirmek için haneleri iki kez tekrarlamanız ve hatayı düzeltmek için azaltmanız gerekir. aktarım hızı, üç kez vererek, her basamağı üç kez geçerek. Ve yine de - hatalar o kadar sıksa, iki veya üç basamaklı bir grupta birden fazla hata olabilirse, böyle bir yöntem hiç uygun olmayacaktır.
Böylesine basit bir yolun asla hata düzeltme olasılıklarının doğru bir şekilde anlaşılmasına yol açmayacağı açıktır. Burada derin bir matematiksel çalışma gereklidir. Ve gürültülü bir kanal için ana teoremini kanıtladığında Shannon'ın yaptığı da tam olarak buydu. Onun muhakemesinin gidişatını takip etmeye çalışalım.
9'a kadar olan sayılar veya alfabedeki harfler gibi bazı karakter gruplarını ileten ayrı bir iletişim sistemi durumunu düşünün . Kolaylık sağlamak için, 0'dan 9'a kadar olan rakamların iletimini göz önünde bulundurun. Bu durum, ŞEK. 8.2. Sol tarafta bir sıra küçük numaralı daireler var; Bunların buton olduğunu varsayalım. Sağ tarafta ayrıca sayıları olan bir dizi daire vardır; Bunları ampul gibi düşünelim. Şeklin sol tarafında yer alan verici üzerinde herhangi bir tuşa bastığınızda alıcılardan birinin ışığı yanmaktadır. sağ tarafta yer almaktadır.
İletişim sistemimizde gürültü olmasaydı, 0 düğmesine basıldığında 0 ışığı her zaman yanardı ve 1 düğmesine basıldığında 1 ışığı vb. Ancak kusurlu bir iletişim sisteminde, yani gürültünün olduğu iletişimde, 4 düğmesine basıldığında, örneğin, Şekil 1'deki oklarla gösterildiği gibi 0 veya 1 lambası veya herhangi bir lamba yanabilir . 4. düğmeden gelen 8.2 .
Resim. 8.2.
Basit bir gürültülü iletişim sisteminde alıcıda bulunan verici düğmesine bastığınızda ışıklardan birinin rastgele yanacağını ve bu daha önce hangi ışığın yandığına bakılmaksızın gerçekleşeceğini varsayalım. Örneğin, 4. düğmeye basılırsa, p 4 olasılığının olduğunu söylüyoruz. (6) 6 numaralı lambanın yanması vb.
Gönderen, belirli bir düğmeye basıldığında hangi ışığın yanacağından emin değilse, o ışık yandığında alıcı hangi düğmeye basıldığından emin olamaz. Bu, ampul 6'dan şeklin sol tarafındaki çeşitli düğmelere giden oklarla gösterilir . Örneğin, ampul 6 açıksa, p 6 olasılığı vardır. (4) 4. düğmeye basıldı , vb. Olasılık p 6 (6) bire eşittir ve p 6 (4), P 6 (9) , vb. olasılıkları yalnızca gürültünün olmadığı böyle bir iletişim sistemi için sıfıra eşittir.
Şek. 8.2, mümkün olan tüm oklar çizilseydi ve mümkün olan her şey çok daha zor olurdu.
Bu olasılıkları saymak bile zor. Yine de, okuyucunun bu örnekten, gönderen belirli bir karakter gönderirse hangi karakterin alınacağı belirsizliğinin derecesi ve doğası ve gönderildiğinde hangi karakterin gönderildiği belirsizliğinin derecesi ve doğası hakkında bir fikir edindiğine inanıyorum. muhatap tarafından hangi karakterin alındığı bilinmektedir. Şimdi gürültülü bir iletişim kanalının özelliklerini daha genel bir şekilde ele alalım. Bu durumda, X ile gösteriyoruz iletilecek karakter ve y aracılığıyla alınacak karakter.
X sembolü olsun mesajın geldiği kaynak tarafından oluşturulur. Eğer bu tür m sembol varsa ve bunlar bağımsız olarak ve p (n) olasılığıyla görünüyorsa , o zaman zaten Bölüm 5'ten bildiğimiz gibi , mesaj kaynağı H(x}' in entropisi , yani, kaynağın bilgi oluşturma hızı şuna eşit olmalıdır:
7P
cehennem \u003d 3 - p (g) günlük p (g). (8.1)
x=1
Cihazımızın çıkışındaki y sembolünü de başka bir mesaj kaynağı olarak değerlendirebiliriz . Ampul sayısının düğme sayısına eşit olması gerekmez, ancak bunun τ⅛κ olduğunu varsayacağız , yani ampul sayısının m'ye eşit olduğunu varsayacağız. O zaman çıkış sinyalinin entropisi şu olacaktır:
7P
W) \u003d Σ ~ ~ P (y) günlük p(y)∙ (8-2)
v=≡1
H(x) yalnızca iletişim kanalının girişine neyin beslendiğine bağlıysa, Wu)'nun hem iletişim kanalının girişine hem de iletim sırasında meydana gelen hatalara bağlı olduğunu belirtelim . Bu nedenle, 4'ten başka bir şey iletilmezse 4 rakamının alınma olasılığı, düğmelere yanlışlıkla basıldığında 4 alma olasılığından farklıdır .
Aynı anda hem vericiyi hem de alıcıyı görebileceğimizi hayal edersek, o zaman belirli w ve !/ kombinasyonlarının ne sıklıkla gözlemlenebileceğini gözlemlemek mümkündür; 4'ün iletilmesi ve 6'nın alınmasının ne sıklıkla gerçekleştiğini söyleyelim.Başka bir deyişle, mesaj kaynağının istatistiksel özelliklerini ve c kanalının istatistiksel özelliklerini bilmek. gürültü, i, y çiftlerinin olasılığını hesaplayabiliriz . Bu olasılıkları bilmek, başka bir entropi hesaplayabilir
t t
y) = Σ SP (w, y) Iogp (x, y). (8.3)
x=1 y=1
x ve y kombinasyonlarının oluşumunun belirsizliğidir .
x'in bilindiğini varsayalım (yani hangi düğmeye basıldığı biliniyor). Bu durumda, farklı ampullerin yanma olasılığı nedir (Şekil 8.2'de soldan sağa oklarla gösterildiği gibi )? Bu olasılıkları hesaplayarak, aşağıdaki entropiyi elde ederiz:
7 puan
Hχ(y)='∑ ∑ — P (*) Px (y) log p x (r/). (8.4)
x=1 ־ y=i
Bu koşullu entropi veya koşullu belirsizliktir. Görünüşte, sonlu sayıda duruma sahip bir makinenin entropi formülüne benzer. Bu durumda olduğu gibi, belirli bir olayın belirsizliğini (örneğin, bir makinenin durumu veya belirli bir x niceliği) bu olayın (durum, x niceliği) meydana gelme olasılığıyla çarparız ve sonra tüm olayları toplarız ( durumlar, miktarlar X).
Son olarak, hangi ışığın açık olduğunu ve çeşitli düğmelere basılma olasılıklarının ne olduğunu bildiğimizi varsayalım. Burada farklı türde bir koşullu entropi elde ederiz:
t t
H y (x) ≈∑ ∑ -P (y) P y (%) Iog p υ (x). (8.5) JZ=IX=I
alındığında x'e verilen belirsizliğin y alma olasılıklarının y çarpımlarının toplamıdır .
x'in ne sıklıkla iletildiğine veya y'nin ne sıklıkla alındığına ve ayrıca iletim sırasında meydana gelen hatalara bağlı olduklarından, mesaj kaynağının istatistiklerine bağlıdır .
Yukarıda tartışılan entropiler en iyi şekilde iletilen ve alınan sembollerin belirsizlikleri olarak yorumlanır:
H(x) , x belirsizliği veya hangi sembolün iletileceği konusundaki belirsizliktir;
H (y) - ־ belirli bir mesaj kaynağı ve belirli bir iletişim kanalı ile hangi sembolün kabul edileceği konusundaki belirsizlik;
-fi r (x, y) ־ — neyin iletileceği konusundaki belirsizlik X 1 ve alınan;
H x (y), x verilirse y'nin ne alacağına ilişkin belirsizliktir . Bu, gönderenin neyin alınacağına dair belirsizliğinin ortalamasıdır;
H y ($), neyin iletildiğinin belirsizliğidir X 1 tarafından kabul edilirse Bu, muhatabın gerçekte neyin iletildiği konusundaki ortalama belirsizliğidir.
Bu miktarlar arasında aşağıdaki ilişkiler vardır:
H(x,y)=H(x) + ∏ x (y), (8.6)
x iletilip y 1 alınacağının belirsizliği Neyin gönderileceğinin belirsizliği x 1 artı neyin alınacağının belirsizliği y 1'e eşittir x gönderilmişse ;
H(x, y) = H (y) + H y (x), ■ (8.7)
neyin alınıp x 1 iletileceğinin belirsizliği y 1'in neyin kabul edileceğinin belirsizliğine eşittir artı y alındıysa X 1 tarafından neyin iletildiğinin belirsizliği .
H x (y) = 0 olduğunda H y (x) olduğunu görüyoruz. ayrıca sıfıra eşit olmalıdır, ardından Shch) - Shch). Bu, alınan sinyalin entropisinin iletilen sinyalin entropisine tam olarak eşit olduğu sissiz bir kanal durumudur. Bu durumda, gönderen tam olarak neyin alınacağını bilir ve alıcı, iletilen mesajın aynısını aldığından emindir.
Verilen karakter alındığında hangi karakterin iletildiğinin belirsizliği, yani entropi Ry ( x), iletimdeki bilgi kaybının doğal bir ölçüsü gibi görünmektedir. Bu gerçekten böyledir ve bu nedenle H y (x) miktarı özel bir isim verilir - iletişim kanalının güvenilmezliği (belirsizliği giderme) . H(x) ve H(y)' yi temsil edersek bit/saniye cinsinden entropi olarak, o zaman bir iletişim kanalı üzerinden bit/saniye cinsinden bilgi aktarım hızı olan 7?'nin şuna eşit olduğu gösterilebilir :
R=H(x) -Hy (X). (8.8)
Bu, bilgi aktarım hızının, kaynağın entropisi eksi güvenilmezliğe eşit olduğu anlamına gelir. Başka bir deyişle, iletilen mesajın entropisi eksi alıcının ne iletildiği konusundaki belirsizliğidir.
Aktarım hızı da
7? = H(y)-H x (y). (8.9)
Başka bir deyişle, iletim hızı, alınan sinyal y'nin entropisi eksi x'in y alındığında iletildiği belirsizliğine eşittir veya alınan mesajın entropisi eksi gönderenin ne olacağına ilişkin belirsizliğidir. kabul edilmiş.
Aktarım hızı şu şekilde de ifade edilebilir:
R \u003d H (x) + H (y) -H (ben, y). (8.10)
Bilgi aktarım hızı, entropi x artı entropi y eksi xny kombinasyonunu elde etmedeki belirsizliğe eşittir . Formül (8.3), p(x, y)'nin tüm xy'ler için sıfır olduğundan, gürültüsüz bir kanal için şunu ima ettiğini unutmayın, x dışında = y, H (x ben y) \u003d - H (x) \u003d H (y). Bu durumda kanal üzerinden bilgi aktarım hızı, bilgi kaynağının H (x) entropisine eşittir .
, Şekil 1'de gösterilen diyagramı kullanarak (8.8) ifadesinin anlamını açıklar . 8.3. Bazı gözlemcilerin iletilen ve alınan sinyalleri karşılaştırdığı ve ardından hatanın düzeltildiği düzeltici bir sinyal gönderdiği bir sistem görüyoruz. Shannon, hatayı düzeltmek için düzeltici sinyalin entropisinin güvenilmezliğe eşit olması gerektiğini gösterebildi.
(8.8) ifadesinden, R hızının olduğu anlaşılmaktadır. hem iletişim kanalının özelliklerine hem de mesaj kaynağının özelliklerine bağlıdır. Şimdi gürültülü bir kanalın, yani kusurlu bir kanalın bilgi iletme yeteneğini nasıl tanımlayabiliriz ? Bu kanal için mümkün olan en yüksek R oranını elde etmek için mesajların kaynağını seçebilirsiniz . Belirli bir kanaldaki bu mümkün olan maksimum bilgi aktarım hızına denir.
Düzeltici sinyal
Resim. 8.3.
kapasitesi ve C harfi ile gösterilir. Shannon'ın gürültülü bir kanal için ana teoremi, kanal kapasitesi C'yi ifade eder . Bu teorem şöyle der:
Ayrık bir kanalın kapasitesi C olsun ve ayrık bir kaynağın saniye başına entropisi H olsun. keyfi olarak küçük güvenilmezlik). H\ > C ise, kaynak güvenilmezlik H - C + 8'den küçük olacak şekilde kodlanabilir , burada 8 keyfi olarak küçüktür. H - C'den daha az güvenilmezlik sağlayan bir kodlama yöntemi yoktur.
Mühendisleri ve matematikçileri çok şaşırtan ifadenin tam olarak formülasyonu budur. İletim hataları daha olası hale geldikçe ve frekansları arttıkça, Shannon tarafından belirlenen kanal kapasitesi giderek azalır. Örneğin, sistemimiz ikili rakamlar iletirse ve bunlardan bazıları hatalı alınırsa, kanal kapasitesi C azalır, yani bir ikili basamak tarafından iletilebilen bilgi bitlerinin sayısı azalır. Ancak rakamların iletimindeki hata sayısı arttıkça kanal kapasitesi kademeli olarak azalır. Önceden belirlenmiş bir düşük hata oranı ile iletim yapabilmek için, iletim hızının kanal kapasitesine eşit veya daha az olacak şekilde düşürülmesi gerekir.
Bu nasıl başarılabilir? Kaynak tarafından üretilen bilgiyi verimli bir şekilde kodlamak için çok sayıda sembolü bir araya getirmenin ve ardından uzun sembol bloklarını bir kerede kodlamanın gerekli olduğunu hatırlayın. Gürültülü kanalın verimli kullanımı için ayrıca birçok sembolden oluşan blokların iletilmesi gerekmektedir. Bu tür bloklarda, yalnızca iletilen ve alınan bazı karakter dizilerinin oluşma olasılığı, kaybolmayacak kadar küçük olacaktır.
Gürültülü bir kanal için ana teoremi kanıtlayan Shannon, kodlar rastgele* seçildiğinde tüm olası kodlar (yani, tüm olası giriş ve çıkış sembol blokları kombinasyonları için) için ortalama hata oranını bulur ve ardından kanal kapasitesi olduğunda bunu gösterir. kaynak entropisinden daha büyükse, tüm olası kodlar üzerinden ortalaması alınan hata oranı, blok çok uzun yapılırsa sıfır olma eğilimindedir. Rastgele seçilen tüm kodların ortalamasını alarak iyi bir sonuç alıyorsak, bu kadar iyi bir kodlama sağlayan en az bir kod olmalıdır. Bir bilgi teorisyeni, bu kanıtlama yöntemini doğaüstü olarak adlandırdı. Tabii ki, bu yöntem ilham almamış bir matematikçi tarafından yaratılamaz ve problemin formülasyonu onun aklına gelmezdi.
־ Burada bahsettiğimiz her şey en genel niteliktedir ve bu nedenle birçok sorunun çözümüne uygulanabilir. Bununla birlikte, bu noktaları açıklığa kavuşturmak için, bu bölümün başında tartışılan ve Şekil 2'de gösterilen hatalı bir ikili kanal örneğine dönmenin yararlı olacağını düşünüyorum. 8.1. Shannon teoreminin bu basit durum hakkında ne söylediğini görelim.
0'ın 0 olarak alınma olasılığı, 1'in 1 olarak alınması p olasılığına eşit olsun. O halde 1'in 0 ve O'nun 1 olarak alınma olasılığı (1) olmalıdır. - p). Ayrıca, bu olasılıkların önceden iletilenlere bağlı olmadığını ve zamanla değişmediğini varsayalım. Ardından, Şekil 1'de temsil edilen * simetrik bir ikili kanal elde ederiz. 8.4 (gösterimin anlamı, Şekil 8.2'deki ile aynıdır ).
Bu kanalın simetrisinden, maksimum bilgi aktarım hızının, yani. kontrol noktası 186
kanal kapasitesi, iletim olasılığı 1'in iletim olasılığı 0'a eşit olduğu bir kaynak için elde edilir. O zaman X için (ve kanalın simetrisinden ve y için) şu sonucu çıkarır:
p(l)≡p(0)=±.
Biliyoruz ki bu koşullar altında
ben (X) = ben (P) =
= -( 1/2 I0g V 2 + 1/2 10g 1/2 ) =
== karakter başına 1 bit.
Peki koşullu olasılıklar nelerdir? Örneğin formül (8.5) ile hesaplanan güvenilmezliğe ne dersiniz ? Bu koşullu entropi, aşağıdaki dört nicelik tarafından belirlenir.
1'i kabul etme olasılığı 1 / 2'dir . 1 alındığında, 1'in gönderilme olasılığı p 1'dir . ve 0'ın gönderilme olasılığı (1 - p) 'dir . O zaman güvenilmezliğe katkıları şuna eşittir:
1
t [ -p Günlük p - (1 -p) Günlük (1 -p)].
1/2 olasılık vardır . 0 alınırsa , 0'ın iletilmiş olma olasılığı p'dir ve 1'in iletilmiş olma olasılığı (1 - p)' dir . Ve güvenilmezliğe katkıları
⅛[~ Plogp - (1 - p)10g (IP)J-
Böylece ikili simetrik bir kanal için güvenilmezlik şu terimlerin toplamına eşittir:
Hy (x) \u003d -P Iog P- (IP) Iog (1 - P).
(8.8)' e göre kapasite C simetrik ikili kanal eşittir
<7 \u003d 1 + p Günlük p + • (1 - p) Günlük (1 - p).
Belirli bir kanal kapasitesi C'nin tam olarak bir eksi Şekil 2'de gösterilen p fonksiyonu olduğuna dikkat edin. 5.1 (s. 103). p≈ 1 ∣ 2> ise kanal kapasitesinin 0 olduğunu görüyoruz . Bu oldukça doğal çünkü bu durumda 1 alınırsa hem 1 hem de 0 aynı olasılıkla iletilebilir ve alınan mesaj gönderilemez. hangi rakamın gerçekten iletildiği konusundaki belirsizliği giderin. Ayrıca kanal kapasitesinin p - için aynı olduğuna dikkat edin. 0 ve p - 1. 1 gönderildiğinde sürekli olarak 0 ve 0 gönderildiğinde 1 alıyorsak veya 1 gönderildiğinde sürekli olarak 1 ve 0 gönderildiğinde 0 alıyorsak , her iki durumda da tam olarak ne olduğunu biliyoruz. transfer edildi.
hata olmadığında verim, değerinin 0,53'üne düşürülür . Her 100 basamakta bir hata alınırsa , kanal kapasitesi yalnızca 0,92'ye düşürülür .
Burada yazar, ikili simetrik kanallar için elde ettiğimiz sonuçların basitliğinin yanıltıcı olabileceğini (en azından yazarın kendisini yanılttığını) belirtmeyi gerekli görmektedir. 1'in 1 olarak kabul edilme olasılığının p'ye eşit olduğu ve 0'ın 0 olarak kabul edilme olasılığının q'ya eşit olduğu ikili tek uçlu bir kanalın optimal hız (kapasite) ifadesi kafa karıştırıcı olabilir. ve daha karmaşık kanalların incelenmesi neredeyse çözülemez zorluklar olabilir.
Muhtemelen bu nedenle ve ayrıca problemin büyük pratik önemi göz önüne alındığında, ikili simetrik bir kanal üzerinden bilgi iletimi problemi üzerine çok sayıda çalışma yapılmıştır. Böyle bir kanal üzerinden hatasız bir iletim elde etmek için hangi kodlar kullanılmalıdır? Temel makalede, Shen- 188
Nona, Hemming tarafından icat edilen örneklerden bahsediyor. Daha sonra 1949'da Marcel Gaulay düzeltici kodlar (yani hata düzeltme kodları) üzerine bir çalışma yayınladı ve 1950'de Hamming de çalışmalarını yayınladı. Bu kodların, Shannon'ın çalışmasının yayınlanmasından sonra oluşturulduğuna dikkat edilmelidir. Açık ve yaralı olabileceklerine inanıyorum , ancak ancak Shannon hatasız aktarım olasılığını kanıtladıktan sonra şu soruyu sormak mümkün hale geldi: "Bu nasıl yapılır?"
Etkili hata düzeltmesi için uzun rakam bloklarını aynı anda kodlamanın gerekli olduğunu daha önce belirtmiştik. En basit örnek olarak, her biri 16 basamaklı iletilen basamak bloklarının kodlanmasını düşünün . Her bloğa, mesajın basamaklarından birinde veya kontrol dizisinde bir hata tespit etmemizi sağlayan bir dizi kontrol basamağı ekleyelim . Somut olması için mesaj basamaklarının sırasını dikkate alın: 110100 1101011000.
Uygun bir test dizisi bulmak için mesajımızın sıfırlarını ve birlerini kare (4×4) bir tabloya yazıyoruz (Şekil 8.5). Bu tabloda, her satır ve sütunun yanına bir daire yerleştirilmiştir.*^* Her daire, her satır veya sütundaki toplam bir sayısı çift olacak şekilde (dairedeki sayı dahil) seçilen sıfırlar ve birler içerir. Bu şekilde eklenen numaralara doğrulama numaraları denir. Bu durumda alınan sayılar
Örneğin, sütunlarda (soldan sağa) kontrol numaralarıyla şu birimleri verin: 2, 2, 2, 4 (hepsi çift) ve satırlarda (yukarıdan aşağıya): 4, 2, 2 , 2 (yine hepsi çift). .
Mesajdaki 16 haneden biri yanlışsa ne olur ? Satırlardan birinde ve sütunlardan birinde tek bir sayı elde edeceksiniz . Bu bizi verilen satırın ve verilen sütunun kesişim noktasındaki basamağı değiştirmeye zorlayacaktır.
Kontrol basamaklarından biri yanlışsa ne olur? Satırlardan birinde veya sütunlardan birinde tek sayıda olanlar olacaktır. Hatayı tespit edip mesajın kendisinde yapılmadığını göreceğiz.
Mesajın 16 hanesini iletmek için gereken toplam hane sayısı 16 + 8 - 24'tür; 24/16 ile ilgili olarak gerekli hane sayısını 1,5'e çıkardık . Orijinal mesaj 400 basamak içeriyorsa, 40 kontrol basamağı gerekir ve basamak sayısını yalnızca 440/400 veya 1,1 oranında artırmamız gerekir . Tabii 440 hanede sadece bir hata düzeltebildik , 24 hanede bir hata düzeltemedik.
İletilen her blokta daha fazla hatayı düzeltmenize izin veren kodlar bulabilirsiniz. Bu, elbette, daha fazla doğrulama basamağı gerektirecektir. Kod, hangi yöntemle oluşturulursa oluşturulsun, sıfırlardan ve birlerden oluşan 2 m'lik bloklar içerecektir; burada M transfer etmek istediğimiz bloğun uzunluğu. Bu kod, hataları düzeltme göreviyle karşı karşıya kalmamışsa, M'den her bloğu görüntülemek için İletmek istediğimiz rakamlar, tam olarak M içeren bloklar kullanabiliriz. rakamlar. Hataları düzeltmek için blok başına daha fazla rakam gerekir.
n iletim hatası ( 0'dan 1'e ve 1'den 0'a değişiklik ) olmasına rağmen hangi bloğun iletildiğini söyleyebilmeliyiz . Bir matematikçi, belirli bir kod için iki blok arasındaki mesafe en az 271 + 1 ise bunun mümkün olduğunu söylerdi .
mesafe kelimesi, matematikçiler tarafından kendi özel amaçları için tanımlanan, biraz alışılmadık bir anlamda kullanılmaktadır. Bu durumda, iki ikili basamak dizisi arasındaki mesafe sıfır sayısına eşittir 190
Bir diziyi diğerine dönüştürmek için değiştirilmesi gereken birim. Böylece, OOIO ve III arasındaki mesafe 3'tür , çünkü bir dizinin üç hanesini değiştirerek bir diziyi diğerine dönüştürebiliriz .
Modül 2 toplama veya mod 2 toplama adı verilen bir işlemi kullanarak iki ikili basamak veya ikili sayı dizisi arasındaki mesafeyi hesaplayabilirsiniz . Modül 2 ( mod 2) ikili basamak ekleme kuralları aşağıdaki gibidir:
0 = 0־4 0
1 = 0+1
1+1=0
2 ikili basamakların eklenmesini göstermektedir.
Hasta
+ 00 1 0
110 1 (3 adet)
10110101
10011101־*־
00101000 (2 adet)
Aynı sonucun, normal ikili gösterimde bir sonraki basamağa aktarılması gerekenleri atarak elde edilebileceğini unutmayın.
Şekil 1'deki daire içine alınmış sayıların olduğuna dikkat edilmelidir. 8.5, ilgili satır ve sütunlara modulo 2 eklenerek elde edilebilir .
IllnOOlO kod grupları arasındaki mesafe tanım gereği 3'tür ve 1011010II0011101 kod grupları arasındaki mesafe 2'dir ; bu mesafeleri toplam modulo 2'deki birimleri sayarak bulduk .
n hata yaptığımızda , gönderilen bloktan n uzaklıkta bir blok elde ederiz ve bu durumda alınan blok, yine iletilebilecek başka bir bloğa n mesafe daha yakın olabilir . Alınan kod grubunun, iletim sırasında n basamaktaki değişikliğe rağmen, iletilen kod grubuna her zaman daha yakın olmasını ve iletilebilecek herhangi bir başka gruba değil, o zaman kullanılan tüm grupları en az olmayan bir mesafeyle ayırmamız gerekir. 271 + 1'den fazla .
n hatayı düzeltmek için , her biri diğerinden en az 27r + 1 uzaklıkta olan 2 m kod grubu bulunmalıdır . Etkili bir kod istiyorsak, bir grupta mümkün olan en az sayıda rakam kullanmalıyız (tabii ki M'den büyük olacaktır ). Çok çeşitli M değerleri için çarpıcıdır. ve 7r Slepyan ve diğer matematikçiler bu en iyi kodları buldular. Nasıl yaptılar, anlatamam!
Ve böylece, M'nin verilen değerleri için en iyi hata düzeltme kodlarını oluşturma genel sorunu ortaya çıktı . ve 7d, çözüldü, o kadar çok var ki onlarla ne yapacağımızı bilmiyoruz. Bunun nedeni, bu yüksek performanslı kodların en uzun ve en verimlisini uygulayan donanımın çok fazla karmaşıklığında yatmaktadır. Blok başına yalnızca bir hatayı düzelten en basit kodlar, birçok önemli pratik durumda yardımcı olamaz. Bu nedenle, bir telefon hattı üzerinden iletirken, ana parazit kaynağı, telefon ekipmanının çeşitli parçalarının çalışması sırasında oluşturulan uzun gürültü darbeleridir. Bu, birkaç ardışık basamakta hatalara neden olur.
Bu talihsiz durum, Bell Telephone Laboratories'den Hagelberger'i yeni bir kodlama yöntemi bulmaya zorladı. Bu yöntem, basamak sayısının iki katını kullanarak altı adede kadar bitişik hatayı düzeltmeye izin verir ve kodlama ekipmanının son derece basit olduğu ortaya çıkar. Bu hata düzeltme yöntemi, etkili ancak yararsız (mühendislikte, matematiksel anlamda değil) yöntemlerin aksine, verimsiz ancak yararlı olarak adlandırılabilir.
Bir önceki bölümde, daha az ikili rakam kullanılarak iletilebilmeleri için mesajlardaki fazlalığı ortadan kaldırmanın yollarını inceledik. Bu bölümde, gürültülü bir kanal üzerinden neredeyse hatasız bir iletim elde etmek için yedekli olmayan bir mesaja fazlalık eklemeyi düşündük. Gürültülü bir kanal kullanıldığında bu kadar hatasız iletimin mümkün olması şaşırtıcıdır . Hala işaretçileri ve matematikçileri şaşırtmaya devam ediyor, ancak Shannon durumun tam olarak böyle olduğunu kanıtlamayı başardı.
Bozulmayan bir kanaldan gönderilen bir mesajı almadan önce, muhatabın birçok olası mesajdan hangisinin iletileceği konusunda bir belirsizliği vardır. Alıcıdaki belirsizlik miktarı, mesaj kaynağının entropisine veya saniyede bit veya sembol başına bit cinsinden ölçülen bilgi oluşturma hızına eşittir. Alıcının hangi mesajın iletileceği konusundaki belirsizliği, gönderilen mesajın bire bir kopyası alındığında tamamen ortadan kalkar.
Mesaj, pozitif ve negatif akım darbeleri kullanılarak iletilebilir. Sinyale, pozitif ve negatif rasgele darbelerden oluşan yeterince güçlü bir gürültü eklenirse, sinyalin pozitif darbeleri negatif olanlara ve negatif olanlar pozitif olanlara dönüşebilir. Bir mesajı iletmek için böyle gürültülü bir kanal kullanıldığında ve gönderen bir karakter gönderdiğinde, muhatap tarafından hangi karakterin alınacağı konusunda bir miktar belirsizlik vardır.
Alıcı, gürültülü bir kanal üzerinden iletilen bir mesaj aldığında, hangi mesajı aldığını kesin olarak bilir, ancak kural olarak bu mesajın iletildiğinden emin olamaz. Böylece, gönderen tarafından hangi karakterin seçildiği konusundaki belirsizlik, alımdan sonra bile tam olarak çözülmez. Bu kalıntı belirsizlik, alınan sembolün iletilen sembolden farklı olma olasılığına bağlıdır.
Gönderenin bakış açısına göre, alıcının aldığı mesajın doğru olup olmadığı konusundaki belirsizliği, mesajların kaynağının belirsizliği veya entropisi artı alıcının hangi mesajın gönderildiğini biliyorsa hangi mesajın iletildiği konusundaki belirsizliğidir . mesaj alındı Shannon bu son belirsizliğe güvenilmezlik adını verdi ve bilgi aktarım hızını mesaj kaynağının entropisi eksi güvenilmezlik olarak tanımladı.
Bilgi aktarım hızı hem gürültü miktarına bağlıdır, yani. kanalın getirdiği belirsizlikten ve hangi bilgi kaynağının iletişim kanalının verici ucuna bağlı olduğundan. Aktarım hızının maksimum olması için bu kaynağın seçildiğini varsayalım. Bu mümkün olan maksimum bilgi aktarım hızı , gürültülü kanalın bant genişliği olarak adlandırılır . Kanal verimi, sembol başına bit veya saniye başına bit cinsinden ölçülür.
Kanal kapasitesi, sembollerin iletimi sırasında meydana gelen çeşitli hataların olasılıkları biliniyorsa hesaplanabilen basit bir matematiksel değerdir. Ancak, bir kanalın bant genişliği kavramı çok önemlidir, çünkü Shannon, gürültülü bir kanal için ana teoreminde, entropinin veya bir mesaj kaynağı tarafından bilgi oluşturma hızının, kanalın kapasitesinden düşük olması durumunda, mesajların Bu kaynak tarafından üretilen kodlanabilir ve önceden belirlenmiş herhangi bir değerden daha düşük bir hata ile gürültülü bir kanal aracılığıyla iletilebilir.
Gürültülü bir kanal üzerinden hatasız iletim için bir mesajı kodlamak için, uzun sembol dizilerini tek bir süper sembolde birleştirmek gerekir. Bu, daha önce karşılaştığımız blok kodlama türlerinden biridir. Burada farklı bir amaç için kullanılıyor. Bunu mesaj fazlalığını azaltmak için değil, fazlalık olmayan bir mesaja fazlalık ekleyerek gürültülü bir kanal üzerinden hatasız iletilebilmesi için kullanıyoruz. Artık, verimli ve hatasız iletişim sorununun, mesajdan zararlı fazlalıkların kaldırılmasına ve mesajın iletimi sırasında meydana gelen hataları düzeltmenize olanak tanıyan bu tür fazlalıkların eklenmesine indirgendiği açıktır.
İletim hatalarını ortadan kaldırmak için mesajları kodlarken kullanmak zorunda kaldığımız fazla rakamlar, elbette iletim hızını azaltır. Gönderilen 100 basamaktan yalnızca birinin hatalı olarak alındığı ikili simetrik bir kanal kullanırken, gürültülü kanalın girişine beslenen her 100 basamak için yalnızca 92 yedeksiz basamak göndermenin mümkün olduğunu gördük . Bu, ortalama olarak yedeksiz her 92 basamak için en az 8 ek kontrol basamağının bir şekilde dahil edilmesi gereken ve böylece toplam basamak akışını gereksiz kılan bir kodun kullanılması gerektiği anlamına gelir.
Shennoy, eserlerinde prensip olarak nasıl hareket edilmesi gerektiğini gösterdi. Ancak karmaşık kanalların incelenmesindeki matematiksel zorluklar çok fazladır. Matematikçiler çok sayıda mükemmel kod bulmuş olsa da, basit ikili simetrik kanallarda bile verimli kodları bulma görevi son derece zordur. Ama ne yazık ki, görünüşe göre kullanılamayacak kadar karmaşıklar!
Çok karamsar bir tablo değil mi? Ama bilgi teorisinin gelişiyle ne kadar da akıllı hale geldik! Sorunun kaynağını biliyoruz. Temel olarak ne kadar iyi çözülebileceğini biliyoruz. Ve sonuç hem mühendisleri hem de matematikçileri hayrete düşürdü. Halihazırda, verimsiz olsa da, hata düzelten kodlarımız var ve bu kodlar bazı durumlarda kullanılabilir. Artık dijital bilginin doğru iletiminin önemi hayal edilemeyecek kadar arttığına göre, bilgi teorisi tanınmaktan çok daha fazlasını hak ediyor.
Dokuzuncu Bölüm
ÇOK BOYUTLU
Yıllar önce (otuz yılı aşkın bir süre önce) St. Paul halk kütüphanesinde, Abbot "Flatland" ın beni dördüncü boyutun gizemleriyle tanıştıran küçük bir kitabına rastladım. İki boyutlu bir dünyadan - kalınlığın olmadığı, tüm nesnelerin ve tüm sakinlerin - hem içeriden hem de dışarıdan - bir kağıda tüm ayrıntılarıyla çizilebildiği bir dünyadan bahsediyordu.
En çok hatırladığım ve hala hayranlık duyduğum şey, Flatland toplumunun tanımıdır . Oradaki tüm sakinler çokgenlerdir ve kenar sayısı sosyal konumlarını belirler. Çok taraflı varlıkların en kıdemlisi, en yüksek konumu, çevreleri işgal eder. En düşük konum, ikizkenar üçgenlerin payına gitti, ancak eşkenar üçgenler zaten bir adım daha yüksek bir konumu işgal ediyor, çünkü formların doğruluğu çok değerli ve bundan gurur duyuyor. "Yanlış" çocuklar yeniden yapılır - kırılır ve ardından formların doğruluğunu elde ederek restore edilir; bu operasyon genellikle trajik bir şekilde sona erer. Kadınlar son derece dar, iğneye benzer canlılardır, dalgalı hareketleri çok çekicidir. Notların yazarı ve kitabın kahramanı - Belirli Bir Kare - bu kelimeyle ilişkilendirdiğimiz şeye çok iyi uyuyor.
Flatland ülkesi matematiksel açıdan da öğreticidir. Kahraman, dünyasında aniden boyutları değişen bir daire belirdiğinde şaşırır. Üç boyutlu bir yaratık olan Sphere'in Flatland uçağıyla kesişmesi olduğu ortaya çıktı. Bu Küre, Meydan'a üç boyutun sırrını açıklıyor ve o da bu garip öğretiyi vaaz ediyor. Okuyucu, bir gün yolunda, belki de, dört boyutlu bir yaratığın dünyamızla üç boyutlu bir kesişimi olan, sallanan ve kaybolan bir varlıkla karşılaşacağı düşüncesiyle baş başa kalır.
Dört boyutlu küpler veya tesseraklar, hiper küreler ve diğer hipergeometrik figürler, birçok bilim kurgu yazarının kitaplarında sıkıcı bir konu haline gelen bir konudur. Dördüncü boyutu, iyi bilinen üçüncü boyuta benzer bir şey olarak hayal edersek, o zaman dört boyutlu uzayda üç boyutlu dünyaları, her sayfanın diğerinden ayrıldığı ve farklı bir yazıyla basıldığı bir kitabın sayfaları olarak hayal edebiliriz. ve farklı dillerde. Dördüncü boyutta bir dünyadan diğerine seyahat etmeyi, örneğin para çalmak için dördüncü boyuttan bir kasaya girmeyi veya bir apandisi çıkarmak için bir hastanın içine girmeyi hayal edebilirsiniz.
faz uzaylarını duymuşuzdur ; burada birçok parçacığın her birinin hızının (momentum) üç koordinatı ve üç bileşeni ölçüm olarak kabul edilir. .
Açıkçası, bu boyutlar, iyi bilinen "üst" ve "alt", "ön" ve "ön" ve "alt" kavramlarıyla ilişkili, birçok açıdan üç boyutluya benzer bir boyut olarak uzamsal dördüncü boyutun klasik fikrinden farklıdır. geri”, “sol” ve “sağ”. On dokuzuncu yüzyıl matematikçileri , geometrileri çok sayıda boyuta sahip uzaylara ve hatta sonsuz boyutlu uzaylara genellemede başarılı oldular.
Saf matematikçi için bu boyutlar yalnızca zihinsel yapılardır. Akıl yürütmesine x ekseni adı verilen bir çizgi ile başlar (Şekil 9.1, a'da gösterilmektedir ). p noktası, x- ekseninde başlangıç noktasının - 0 - sağında x p uzaklıkta yer alır . Diğer bir deyişle, x p koordinatı, p noktasının konumunu tanımlar .
Matematikçi daha sonra x eksenine dik bir y ekseni ekler. (Şekil 9.1, b). İki boyutlu uzayda p noktasının konumunu veya bu iki eksenin bulunduğu düzlemi iki sayı veya koordinatlar aracılığıyla belirleyebilir - y yönünde orijinden 0 uzaklığı, yani y yüksekliği p ve orijinden x yönündeki x p mesafesi .
y ve z eksenlerinin (Şekil 9.1, c) bir küpün yüzleri gibi birbirine diktir. Bu eksenler, üç boyutlu uzayın iyi bilinen yönlerinden başka bir şey değildir. p noktasının konumu, başlangıç noktası 0'ın üzerindeki y p yüksekliği , X p mesafesi ile verilir. orijinden x ekseni boyunca 0 ve z p mesafesi z ekseni boyunca orijin 0'dan .
Tabii ki, x, y, z eksenleri Resimde. 9.1, birbirine dik değildir. Bu, tüm eksenlerin birbirine dik olduğu gerçek bir 3B alanın 2B perspektif çizimidir. Benzer şekilde, ŞEK. 9.1, d , beş boyutlu uzayda eksenlerin iki boyutlu bir perspektif taslağını gösterir. x, y ve z Latin alfabesinin son harfleri olduğundan , matematikte alışılageldiği üzere bu yönleri basitçe i!, i 2 " #3" #4" $5" olarak etiketledik .
Elbette çizimde, bu beş eksen, Şekil 2'deki üç eksen gibi birbirine dik değildir. 9.1, yak. Üç boyutlu uzayımızda, karşılıklı olarak beş dikey çizgi düzenlemek imkansızdır, ancak bir matematikçi, beş veya daha fazla eksenin karşılıklı olarak dik olduğu böyle bir "uzayı" mantıksal olarak ele alabilir. Çeşitli geometrik şekillerin özelliklerini, p noktasının konumunun beş koordinatla tanımlandığı beş boyutlu uzayda türetebilir : x ip , x 2p1 x 3p , x½ p , x 5p . Böyle bir uzayı sıradan üç boyutlu uzaya (Öklid uzayı) benzer hale getirmek için, matematikçi mesafenin karesinin alındığını söyler . koordinatların orijininden p noktası şu şekilde tanımlanır:
d* = x l n ÷ x L ÷ rc L ÷ rc L + ⅛∙ (9 . 1 )
ip 1 2p 1 Sp , 4p , DPx ,
Matematikçiler, çok boyutlu uzayda bir "kübik" şeklin "hacmini", kenarlarının uzunluklarının çarpımı olarak tanımlarlar. Yani, iki boyutlu uzayda böyle bir şekil
2 / J
Şekil 9.2, bir karedir ve her bir kenarının uzunluğu L 9'a eşitse o zaman "hacim" karenin alanına eşittir, yani. L 2 . Üç boyutlu uzayda, bir kenarı L olan bir küpün hacmi Z/ 3'e eşittir . Beş boyutlu uzayda, kenarı L olan bir hiperküpün hacmi L b 9'a eşittir ve kenarı L j ∖ ojιm olan doksan dokuz boyutlu bir küp . I hacmine sahip".
Çok boyutlu uzayda şekillerin bazı özellikleri, sadeliklerine rağmen oldukça şaşırtıcı ve beklenmediktir. Örneğin, birinin yarıçapı 1'e , diğerinin yarıçapı 1/2'ye eşit olan iki eşmerkezli daireyi ele alalım. (Şekil 9.2). Çemberin alanı (“hacim”) lg 2 , yani dış çemberin alanı l ve iç çemberin alanı l ( 1 ∕ 2 ) 2 = ( 1 ∕ 4 ) l . Böylece, büyük dairenin alanının dörtte biri, yarı çaplı bir dairenin içinde yer alır.
Şimdi Şekil l'de olduğunu hayal edin. 9.2 daireleri değil, topları veya küreleri gösterir. Kürenin hacmi ( 4 ∕ 3 ) x 9 , ve" dolayısıyla 1 / 8 Büyük bir kürenin hacmi, yarı çaplı bir kürenin içine alınır. Benzer şekilde, 7r boyutlu bir kürenin hacmi rn 9 ile orantılıdır . ve yarı yarıçaplı bir hiperkürede bulunan hacim 1 ∕ 2 n'dir dış hiperkürenin hacminin bir parçası. Yani, p'de = 7 yarı yarıçaplı hiperkürenin hacmi, dış hiperkürenin hacminin 1 Z 128'idir .
kullanılarak , yarıçapı r olan bir hiperkürenin hacminin hangi bölümünün 0.99r yarıçaplı bir hiperküre içinde yer aldığı bulunabilir. 1000 boyutlu bir küre 0.00004 durumunda , hacminin bir kısmının 0.99r yarıçaplı bir küre içine alındığı ortaya çıktı. Dolayısıyla kaçınılmaz olarak 200
çok boyutlu bir uzayın bir hiperküresinin tüm hacminin, bu hiperkürenin yüzeyinin yakınında yoğunlaştığı sonucu çıkar!
Evet, bunların hepsi, diyorsunuz ki, en gerçek saf matematik ve ayrıca en gizemli ve anlaşılmaz türden! Değil mi? Bu sorunun cevabı, yukarıdaki fikirlerin gerçek fiziksel dünyadaki bazı problemlere uygulanana kadar saf matematik olduğudur. ]n - 1 gibi hayali sayıların da bir zamanlar fiziksel bir anlamı yoktu, ancak elektrik mühendisliği ve fizikte bunu kazandılar. Öyleyse, hiperkürenin matematiksel özellikleriyle tam olarak tanımlanacak böyle bir fiziksel fenomen bulmak mümkün mü? Kuşkusuz, en azından matematiksel iletişim teorisinde mümkündür. Shannon, gürültü varlığında sınırlı bant genişliği ile sürekli bir sinyalin iletimi ile ilgili önemli bir teoremi kanıtlamak için yüksek boyutlu uzayın geometrisini kullandı.
Shannon'ın çalışması, büyük pratik ilgi alanına giren bir sorunu çözmek için yeni fikirlerin, yeni bir bakış açısının ve mevcut ancak kullanılmayan bir matematik alanının (bu durumda, çok boyutlu uzayların geometrisi) nasıl kullanılacağına dair harika bir örnektir. Bana öyle geliyor ki, uygulamalı matematiğin böylesine mükemmel bir örneğini gözden kaçırmak imkansız ve ben Shannon'ın muhakemesinin özünü araştırmayı öneriyorum. Şahsen, muhakemesi bana zor olmaktan çok alışılmadık görünüyor, ancak okuyucunun bunu kendisi anlamasına izin verin.
Gürültü varlığında sürekli sinyallerin iletilmesi problemini ele almadan önce, bazı basit sinyal ve gürültü kuvveti ölçümlerine sahip olmak gerekir. Bu amaçla, güç oldukça uygundur.
1 kg'lık bir yükü %1'lik bir yüksekliğe kaldırmak için 1 m'lik bir yolda 1 kg'lık bir kuvvet uygulandığında iş yapılır . Bu durumda yapılan iş miktarı 1 kilogram metreye (kgm) eşittir . Yüksekliğe kaldırıldıktan sonra yük 1 kgm'ye eşit bir enerji kazandı . Bu yük alçalırken (örneğin saatlerde olduğu gibi) bu enerjiye eşit iş yapabilir.
Güç , işin yapılma hızıdır. Dakikada 4500 kgm enerji harcayan ve dakikada 4500 kgm iş yapan bir makinenin gücü tanım gereği 1 beygir gücüne ( hp ) eşittir. Elektrik hesaplamalarında, diğer enerji ve iş birimleri kullanılır - joule (J) ve güç - watt (βm) ∙ 1 1 W = 1 jsn.
Sinyal voltajı iki katına çıkarsa, enerjisi ve gücü dört kat artacaktır. Enerji ve güç, sinyal voltajının karesiyle orantılıdır.
Bölüm 4'te W bant genişliğine sahip sürekli bir sinyalin olduğunu gördük. 2W'daki değerleriyle tamamen eşlenebilir saniyede referans noktaları. Ve tam tersi, önceden seçilmiş herhangi bir 2 W'tan geçecek bant sınırlı bir sinyal oluşturabiliriz. istediğiniz gibi seçebileceğiniz saniye başına referans noktaları. Her okumayı keyfi olarak ayarlayabilir ve diğer okumaları değiştirmeden değiştirebilirsiniz. Örnek değiştirilirse, bant sınırlı sinyal buna göre değişir.
Okuma genliği volt olarak ölçülebilir. Her okuma voltajının karesiyle orantılı bir enerji gösterir.
Böylece, okuma genliklerinin kareleri enerji birimleri cinsinden ifade edilebilir. Uygun rastgele enerji birimleri kullanarak, enerjiyi okuma genliğinin karesine eşitlemek oldukça mümkündür.
x 11 harfleriyle ölçelim. x 2 , Xs , vb. Okumalar tarafından gösterilen sinyal enerjisinin bölümleri sırasıyla xj, X 2 3 ' e eşit olacaktır. vb. E 1 ile göstereceğimiz sinyalin toplam enerjisi bu enerjilerin toplamına eşit olacak
E = xl + xl + xl+... (9.2)
E miktarının geometrik terimlerle ifade edildiği açıktır. çok boyutlu bir uzayın koordinatları olarak x 1 , i 2 , i 3 , vb . alırsak, tam olarak orijine olan uzaklığın karesine eşittir !
yani birlikte alınan tüm örneklerin ve karesinin bir görüntüsü olacaktır. noktanın orijinden uzaklığı toplam sinyalin enerjisini gösterecektir.
Sinyali neden bu özel geometrik formda göstermek istiyoruz? Shannon'ın bu yöntemi kullanmasının nedeni, geometrik temsillerin, gürültünün sinyal iletimi üzerindeki etkisiyle ilgili önemli bir bilgi teorisi teoremini kanıtlama fırsatı sağlamasıdır.
3'te benimsediğimiz sinyal kaynağının matematiksel modeline dönelim. Burada kaynağın durağanlık ve ergodiklik özelliklerine sahip olduğunu varsaydık. Söz konusu gürültü ve sinyal artı gürültünün ekşi krema "kaynağı" hakkında aynı varsayımlar yapılmalıdır.
Böyle bir kaynağın çok uzun bir dizi çok yüksek enerji örneğinden veya çok uzun bir çok düşük enerji örneği dizisinden oluşan bir sinyal veya gürültü üretmesi pratik olarak imkansız değildir. Her halükarda, bu, ergodik bir kaynak tarafından son derece uzun bir E harfleri dizisinin yaratılmasından daha az imkansızdır. Burada, ilk olarak Bölüm 5'te karşılaştığımız bir teoremi uygulamamız gerekiyor. Ergodik bir kaynak, bazı en olası mesajlar sınıfını ve ihmal edilebilecek kadar olası olmayan bazı mesajlar sınıfı üretebilir. Bizim durumumuzda, oluşturulan okumaların ortalama gücünün ergodik kaynağın zaman içindeki (ve topluluk üzerindeki) ortalama gücünden önemli ölçüde farklı olduğu mesajlar olası değildir.
Bu nedenle, dikkate almamız gereken tüm uzun mesajlar için iyi tanımlanmış bir ortalama sinyal gücü vardır ve bu güç zaman içinde fark edilir şekilde değişmez. Bu ortalama güç, çok sayıda ardışık okumanın enerjileri toplanarak ve elde edilen toplam , bu okumaların alındığı T süresine bölünerek ölçülebilir . T zaman aralığı ise daha uzun ve daha uzun sürer ve numune sayısı - gittikçe daha fazla, o zaman ortalama gücün değeri giderek daha doğru olacaktır. Kaynağın durağanlığından dolayı bu ortalama
güç, hangi okuma dizisinin incelendiğine bakılmaksızın aynı değere sahip olacaktır.
Bu farklı da söylenebilir. Dikkate almanın anlamsız olacağı kadar olasılık dışı durumlar dışında, sabit bir kaynak tarafından üretilen çok sayıda ardışık okumanın toplam enerjisi, hangi dizi seçilirse seçilsin, yaklaşık olarak aynı değere sahip olacaktır (yani, bağıl fark küçük olacaktır). okumaların
Sinyallerin kaynağı durağanlığın yanı sıra ergodiklik özelliğine de sahip olduğundan, hakkında daha çok şey söylenebilir. Bu kaynak tarafından üretilen her sinyal için (ne tür sinyal olduğuna bakılmaksızın), aynı sayıda ardışık numunenin enerjisinin yaklaşık olarak aynı değere sahip olacağı ve enerji arasındaki bağıl farkın pratik amaçlar için yeterli doğrulukla söylenebileceği söylenebilir. okuma sayısı arttıkça azalır.
Böyle bir kaynağın sinyallerini hiper uzay noktalarına eşleyelim. Bant genişliği sinyali W ve süre T 2WT görüntülenebilir sayar. Bu okumaların her birinin genliğinin, hiperuzay koordinat eksenlerinden biri boyunca bir mesafe olmasına izin verin. Bir numunenin ortalama enerjisi P ise, toplam enerji 2WT Yeterince büyük olması koşuluyla örnekler 2WTP değerine çok yakın olacaktır . Bu toplam enerjinin, sinyali temsil eden noktanın koordinatların orijininden ne kadar uzakta olduğunu belirlemek için kullanılabileceğini zaten gördük. Dolayısıyla, sayım sayısı arttıkça, aynı süredeki farklı sinyalleri temsil eden noktalardan ]f2WTP yarıçaplı bir hiperkürenin yüzeyine olan mesafe (bir yarıçapın kesirleri olarak ölçülür) gittikçe küçülecek. Çok sayıda boyuta sahip bir uzayda bir hiperkürenin neredeyse tüm hacminin yüzeyine çok yakın bir yerde toplandığını hatırlarsak, çeşitli sinyalleri temsil eden noktaların yüzeye bu kadar yakın olması şaşırtıcı değildir.
Ancak sinyalin kendisini değil, üzerine gürültü bindirilmiş sinyali alıyoruz. Shannon'ın dikkate aldığı gürültüye beyaz Gauss gürültüsü denir . kelime beyaz 204
bu gürültünün tüm frekansları eşit olarak içerdiği anlamına gelir; gürültünün W Hz frekansına kadar olan tüm frekansları ve W Hz üzerindeki frekansları içerdiğini varsayıyoruz. içermiyor. Gauss kelimesi, birçok doğal sis kaynağı için geçerli olan bir yasa olan okumaların genlikleri üzerindeki olasılık dağılımı yasasını belirtir. Böyle bir Gauss gürültüsü için tüm 2W gürültüyü temsil eden saniyedeki örnekler alakasız veya ilişkisiz ve bağımsız çıkıyor. Ortalama referans enerjisi bilinse bile (ki bunu N ile göstereceğiz ), Birkaç sayının enerjisini bilmek, diğerlerinin enerjisini tahmin etmeye yardımcı olmaz. Görünür enerji 2WT bu gürültünün örnekleri 2WTN'ye çok yakın olacak yalnızca 2WT, bu toplam enerjinin, sinyal örnekleri üzerine bindirilen herhangi bir gürültü örneği dizisi için yaklaşık olarak aynı değere sahip olacağı kadar büyükse.
Belli bir mesafeye yerleştirilmiş belirli bir hiperuzay noktası tarafından belirli bir sinyal örnekleri dizisinin görüntülendiğini zaten gördük]/ 2WTP kökenden. Sinyal artı gürültünün toplamı, sinyali temsil eden noktadan küçük bir mesafede bulunan belirli bir nokta ile temsil edilir. Gerçekten de, sinyal noktasından sinyal artı gürültü noktasına olan mesafenin ^2WTN olduğunu görüyoruz. Bu nedenle, üzerine gürültü bindirilmiş sinyal, yarıçapı küçük bir hiper kürede bulunur ^]∕^2WTN sinyali temsil eden nokta merkezlidir.
Ayrıca, sinyali saf haliyle almıyoruz. Ortalama enerji P ile bir sinyal alıyoruz Örnek başına ortalama enerji N ile üzerine bindirilmiş Gauss gürültüsü ile örnek başına . T süresi boyunca alınan toplam enerji 2WT'dir (P + N), ve üzerine gürültü bindirilmiş son sinyallerin bazılarını temsil eden bir nokta, yarıçapı ]∕ r 2WT (P + N) olan bir hiper kürede yer alır.
T süresine sahip bir sinyal aldıktan sonra üzerine gürültü bindirilmiş saniyeler içinde, üzerine gürültü bindirilmiş sinyali gösteren noktanın konumunu belirleyebilirsiniz. Ama sinyalin kendisini nasıl bulabilirim? Sadece bu sinyalin ^2WTN'den daha kısa bir mesafede olduğunu biliyoruz. üzerine gürültü bindirilmiş sinyali temsil eden noktadan.
Hangi sinyalin gönderildiğini doğru bir şekilde nasıl belirleyebilirsiniz? Varsayalım ki ]f2WT (P + N) yarıçaplı bir hiper küreye , üzerine gürültü bindirilmiş sinyali temsil eden noktaların olması gereken yerde, yarıçapı V2WTN'den biraz daha büyük olan çok sayıda kesişmeyen küçük hiperküre gömülür. Artık yalnızca bu küçük kürelerin merkez noktalarının konumuyla gösterilen sinyalleri gönderiyoruz.
2WT alırsak gürültü örneklerinin üst üste bindirildiği sinyallerimizden birinin örnekleri, hiperkürenin karşılık gelen noktası, yalnızca verilen sinyali temsil eden noktayı çevreleyen küçük hiperküreye düşecek, başka hiçbir yere girmeyecektir. Bu, daha önce belirttiğimiz gibi, ergodik gürültü kaynağı tarafından üretilen uzun okuma dizisini temsil eden noktaların, ^2WTN yarıçaplı kürenin hemen hemen yüzeyinde yer alması gerektiği gerçeğiyle açıklanmaktadır . Böylece, gürültünün varlığına rağmen, gönderilen sinyal hatasız bir şekilde tanımlanabilir.
↑f2WTN yarıçaplı kesişmeyen bu tür kaç hiperküre yarıçapı Y2WT (P + N) t olan bir hiper küreye yerleştirilebilir mi ? Bu sayı elbette büyük kürenin hacminin küçük kürenin hacmine oranından büyük olamaz.
Uzay boyutlarının sayısı n, sinyal (ve gürültü) örneklerinin sayısına 2WT eşittir. n-boyutlu uzayda bir hiperkürenin hacmi, rn ile orantılıdır . Bu nedenle, "büyük sinyal artı gürültü küresinin" hacminin küçük "gürültü küresinin" hacmine oranı eşittir
']/2WT (P + IV) 1 2vrr _ Z P+N ∖ wτ
y2WTN -־ ∖ WJ
T zamanında iletilebilecek farklı mesajların sayısındaki sınırdır. Bu sayının logaritması, aynı T zamanında iletilebilecek bit sayısına eşittir .
^10 gr (⅛^U).
Mesaj süresi T olduğundan saniye, sonra karşılık gelen bit/saniye, C r ,
C = ITlog(1 + 4). (9.3)
Bu sonuca ulaştıktan sonra, sinyal örneğinin ortalama sinyal enerjisinin sis örneğinin ortalama enerjisine oranının, ortalama sinyal gücünün ortalama sis gücüne oranına eşit olması gerektiği görülebilir ve bu nedenle şunu yapabiliriz: PIN oranını göz önünde bulundurun (9.3) ifadesinde , ortalama sinyal sayım enerjisinin ortalama gürültü sayım enerjisine oranıyla değil, sinyal gücünün gürültü gücüne oranıyla.
(9.3) ortaya çıkmasının bir sonucu olarak yukarıdaki akıl yürütme, H 7'lik bir bant genişliği için ve N 1 gücüne sahip Gauss gürültüsü ile karıştırılmış P gücüne sahip bir sinyalin kullanıldığını gösterir. C'den fazlası aktarılamaz Saniye başına bit. Bununla birlikte, çok sayıda boyuta sahip bir uzayda bir hiperkürenin neredeyse tüm hacminin yüzeyinin yakınında yoğunlaştığı gerçeğini kullanan Shannon'ın daha ileri geometrik muhakemesi, sinyal iletim hızını C 1 değerine yaklaştırma olasılığını da gösterdi. formül (9.3) ile hesaplanır, keyfi olarak az sayıda hatayla keyfi olarak kapatın. Bu nedenle, C değeri ifadeden (9.3), Gauss gürültüsünün sinyal üzerine bindirildiği sürekli bir iletişim kanalının bant genişliğinden başka bir şey değildir.
(9.3) ifadesini, 1928'de Nyquist ve Hartley tarafından önerilen ve Bölüm 2'de tartışılan bilgi miktarı ve iletim hızı ifadeleriyle karşılaştırmak ilginç olabilir. Nyquist ve Hartley'in sonuçları, ikili basamak sayısının saniyede iletilebilir,
7g giriş
Burada m , kullanılan farklı sembollerin sayısıdır ve r, saniyede iletilen sembollerin sayısıdır.
Sembol olarak herhangi bir voltaj değerini alabilirsiniz, örneğin +3, +1, -1, -3. Bizim gibi Nyquist, saniyede iletilebilecek bağımsız örnek sayısının veya voltaj değerlerinin 2 IL olduğunu biliyordu.Bu gerçeği kullanarak, ifade (9.3) şu şekilde yeniden yazılabilir:
c =τ 10 ≡ ( 1 +-⅞-) '
VEYA
C=nlog ]L 1 +־ag•
Bu ifadelerin türetilmesinde (9.3) ifadesine giden adımlar tekrarlanmıştır.
(9.3) 'ün, örnek başına iletilebilen farklı sembollerin (7n) ortalama sayısının, sinyal gücünün gürültü gücüne oranına bağımlılığını ortaya koyduğunu görüyoruz . Sinyal gücü çok düşerse veya gürültü gücü çok artarsa, PIN neredeyse sıfır olur, o zaman örnek başına iletebileceğimiz ortalama farklı karakter sayısı yaklaşır
Günlük 1 = 0.
Böylece, örnek başına iletilebilen ortalama sembol sayısı ve kanal kapasitesi, sinyal gücü/gürültü güç oranı sıfıra yaklaştıkça sıfıra yaklaşır. Elbette sinyal gücünün gürültü gücüne oranı arttıkça örnek başına iletebileceğimiz sembol sayısı ve kanal kapasitesi artar.
Ancak artık numune başına çok sayıda bağımsız sembolün nasıl iletileceğini Nyquist ve Hartley'den daha iyi biliyoruz. Bunu olabildiğince verimli yapmak için, her karakteri belirli bir voltaj örneği ile kodlamaya çalışmamalısınız. Artık aşina olduğumuz blok kodlama tekniğine başvurmamız ve çok sayıda ardışık örnek kullanarak uzun bir sembol dizisini kodlamamız gerekiyor. Dolayısıyla, sinyal gücünün gürültü gücüne oranı 24 ise, o zaman örnek başına ortalama ]/ r I + 24 = ]/"25 = 5 farklı simgeyi ihmal edilebilecek kadar az sayıda hatayla iletmek mümkündür , ancak hiçbiri bu 5 farklı sembol, belirli bir örnek kullanılarak iletilemez.
Şekil örneğinde. 8.1 (s. 177), kendisini belirli bir genliğin pozitif veya negatif darbesini temsil eden bir sinyal kullanarak bir ikili basamakta sis varlığında iletimi düşündük ve üzerine gürültü bindirilmiş bu sinyal varsa bir birimin alındığını söyledik. pozitif olduğu ve üzerine gürültü bindirilmiş alınan sinyalin negatif olduğu ortaya çıkarsa sıfır olduğu ortaya çıktı. Gürültünün Gauss olduğunu ve sinyalin, alınan 100.000'de yalnızca bir hanenin hatalı olacağı gürültüye kıyasla yeterince güçlü yapıldığını varsayalım. Hesaplamalar, bunun aynı bant genişliği ve aynı gürültü gücü için (9.3) ifadesine göre gereken gücün yaklaşık altı katını gerektireceğini göstermektedir . Ek güç gereklidir, çünkü tek bir ikili basamağı görüntülemek için kısa bir pozitif veya negatif darbe kullandık ve aynı anda uzun bir ikili basamak dizisini görüntülemek için çeşitli genliklere sahip çok sayıda ς örneğinden oluşan birçok uzun sinyalden birini kullanmadık .
Ortalama sinyal gücü düşük ve gürültü gücü yüksek olduğunda ideal sinyal hızına veya kanal kapasitesine yaklaşmanın özel bir yolu vardır. Sinyal gücünün kısa ama güçlü bir darbede yoğunlaştığı ve bu darbenin birçok olası zamandan birinde iletildiği ve bu zamanların her birinin belirli bir sembol gösterdiği gerçeğinde yatmaktadır. Bu çok özel ve sıra dışı durumda, karakterleri birer birer iletmek verimlidir .
Genel olarak, ideal sinyalleşme hızına yaklaşmak için, Gauss gürültüsünü anımsatan bir dizi uzun, karmaşık sinyal dalgasını kod öğeleri olarak kullanmalıyız.
İsterseniz, (9.3) ilişkisine biraz daha geniş bir bakış atabilirsiniz . Bu ifade bize sadece belirli bir iletişim kanalı üzerinden saniyede kaç bit gönderilebileceğini değil, aynı zamanda belirli bir frekans spektrumuna ve gerekli sinyal-gürültü oranına sahip bir sinyalin bir iletişim kanalı üzerinden iletilmesi olasılıkları hakkında da bir şeyler söyler. biraz farklı bant genişliği ve farklı sinyal-gürültü oranı. göndermemiz gerektiğini varsayalım.
^a&yüzler 13
4 MHz bant genişliğine sahip sinyal ve sinyal gücünün gürültü gücüne oranını elde edin PIN, 1000'e eşittir . İlişki (9.3) bize karşılık gelen kanal kapasitesinin şuna eşit olduğunu söyler:
C == 40.000.000 bps.
Ancak bu bant genişliği, Tabloda gösterildiği gibi diğer kombinasyonlarla da elde edilebilir. 13.
Bu tablodan, belirli bir kanal kapasitesi elde etmek için daha geniş bir bant genişliği ve daha düşük bir sinyal-gürültü oranı veya daha dar bir bant genişliği ve daha yüksek bir sinyal-gürültü oranı kullanmanın mümkün olduğu görülebilir.
İlk bilgi teorisyenleri, kullanılan gücü artırarak gerekli bant genişliğini azaltma fikriyle oynadılar. Ancak bu muazzam bir enerji gerektirecektir. Deneyimler, gerekli olandan daha az güçte iyi bir sinyal-gürültü oranı elde etmek için bant genişliğini artırmanın çok daha faydalı ve pratik olduğunu göstermiştir.
Bu tam olarak FM vericisinde yapılan şeydir. Müzik gibi iletilen mesajın sinyal genliği, içinde belirli bir frekanstaki bir radyo sinyali tarafından kodlanır. İletilen mesaj sinyalinin genliği artar ve azalırsa, FM ekran sinyalinin frekansı buna göre değişir. 15.000 Hz frekans spektrumuna sahip yüksek kaliteli müzik iletirken , FM sinyalinin frekansı 150.000 Hz aralığında değişebilir . FM iletimi, kodlanmış müziğin bant genişliğinden çok daha büyük bir bant genişliği kullandığından, alınan müziğin sinyal-gürültü oranı, radyo tarafından alınan FM sinyalinin sinyal gücü-gürültü gücü oranından çok daha yüksek olabilir. Bununla birlikte, FM sisteminin verimliliği mükemmel değildir; bu sistem ifade (9.3)' e göre bekleneni vermemektedir .
Yetenekli mucitler her zaman daha da iyi bir modülasyon sistemi bulmaya çalıştılar. Bana iki kez (9.3) ifadesinin izin verdiğinden daha iyi çalıştığından emin olduğum bir sistem teklif edildi . Öneriler makul görünüyordu, ancak burada, sürekli hareket makinesinde olduğu gibi, bir şeylerin ters gittiğini biliyordum. Ve gerçekten de dikkatli analiz, hatanın nerede olduğunu gösterdi. Böylece, bilgi teorisi bize hala neyin yapılıp neyin yapılamayacağını söyler.
Örneğin, sinyal-gürültü oranını iyileştirmek için bant genişliğini artırarak, sinyal gücünün gürültü gücüne tüm oranları için eşit derecede iyi olacak böyle bir sistem yapmak imkansızdır.
Bu bölümde sunulan bakış açısına göre, bir sinyali, boyutların sayısının örnek sayısına eşit olduğu çok boyutlu bir uzayda bir nokta olarak ele alıyoruz. Az sayıda örnek tarafından görüntülenen dar bantlı bir sinyali, çok sayıda örnek tarafından görüntülenen geniş bantlı bir sinyal aracılığıyla iletmek için, uzayın noktalarını az sayıda örnekle bire bir haritalamak gerekir. çok sayıda boyuta sahip uzay noktalarına boyutlar.
Bölüm 1'de , iki boyutlu uzaydaki (düzlem) noktaların tek boyutlu uzaydaki (çizgiler) noktalara eşlenmesiyle ilgili bir teoremi kanıtladık. Düzlemin her noktasının doğrunun karşılık gelen noktasına bire bir eşlenmesinin sürekli olamayacağını kanıtladık. Başka bir deyişle, eğer biri düzlemin bir noktasından diğerine herhangi bir yol boyunca atlamalar olmadan sorunsuz hareket ederse, o zaman çizginin karşılık gelen noktaları zorunlu olarak bu çizgi boyunca rastgele dağılacaktır. Benzer bir teorem, herhangi bir uzayın noktalarını farklı sayıda boyuta sahip bir uzayın noktalarına eşleme durumu için de geçerlidir. Bu, iletilen mesajın az sayıda örneğinin çok sayıda sinyal örneği tarafından eşlendiği iletim sistemleri için her türlü zorluğu vaat eder.
Круг неопределен- носгпи, о бу ело в- ленной шумом
Фиг, 9,3,
Shannon bu zorluğun basit bir örneğini veriyor. Bu örnek, Şek. 9.3. Genlikli tek bir örnek ve genlikli iki örnek v i görüntülemek için varsayalım ve v2 ._ _ v i dikkate alacağız ve V2 _ karenin sol alt köşesinden yatay ve dikey mesafeler. Sol alt köşeden başlayarak karenin içine eğri bir çizgi çizilir. Bu çizgi boyunca, sol alt köşenin yakınında bulunan başlangıcından hat üzerindeki belirli bir noktaya kadar ölçülen mesafenin ve - iletilen sinyalin voltajına veya genliğine eşit olmasına izin verin.
Elbette her değer ve belirli değerler v i ile gösterilir ve v2 , _ Görüyoruz ki v i aralığı ve v2 _ değişim aralığından daha az ve. v i'yi geçebiliriz ve v2 , _ ve sonra büyük bir doğrulukla geri yükleyin . Her zaman mümkün mü?
Diyelim ki v i ve V2 _ alıcıda karşılık gelen değeri bulmaya çalıştığımızda ve gürültü nedeniyle gürültü nedeniyle belirsizlik çemberinin bir noktasına düşeceğimiz için biraz gürültü üst üste bindirilir. Dairenin çapı, dolambaçlı yolun ilmekleri arasındaki mesafeden daha az olduğu sürece, tam değerinin ve v i değerlerindeki göreli hatalardan çok daha küçük bir göreli hata ile yeniden üretildiği iddia edilebilir. ve V2- Ama eğer gürültü daha büyükse, artık dolambaçlı yolun tam olarak hangi döngüsünün kastedildiğini söyleyemeyiz ve bu nedenle çoğu zaman u'nun tanımında büyük bir hata yaparız .
Daha iyi bir sinyal-gürültü oranı elde etmek için daha fazla bant genişliğinin kullanıldığı FM gibi sistemlerde bu tür şeyler kaçınılmazdır. İletim üzerine bindirilen gürültü arttıkça, alınan (Modülasyonlu) sinyalde bulunan gürültü ilk başta biraz* artar ve ardından hızla feci boyutlara yükselir. Bu sinyal-gürültü oranı düzeyinde, sistem çalışmayı reddeder. Bu nedenle, ilk bakışta soyut olan bir matematik teoremi, bazı elektrik sistemlerinin ortadan kaldırılamayacak özelliklere sahip olduğunu öne sürdü.'
Bu bölümde ağırlıklı olarak geometrik yöntemler kullanılmıştır. Ancak bu, sürekli sinyallerle ilgili sorunları çözmenin yollarından yalnızca biridir. Shannon, matematiksel iletişim teorisi üzerine kitabında, her türden sinyal ve gürültü için geçerli olan farklı bir yöntem kullandı. Bununla birlikte, elektrik sinyalleriyle ilgili çok sayıda (doğrudan bilgi teorisi ile ilgili olmayan) problemlerin çözümünde özellikle yararlı olan basit ve açık olduğu için geometrik yöntem özellikle ilgi çekicidir.
Bu bölümde, sınırlı bant genişliğine sahip sinyallerin geometrisine giriş yaptık. Sinyal okumaları aldık ve genliklerini çok boyutlu bir uzayda noktaların koordinatları olarak değerlendirdik. Bununla birlikte, örnekler hakkında tek kelime etmeden, sınırlı bir bant genişliğine sahip sinyallerin geometrisini elde etmek oldukça mümkündür. Sinyal iletimi problemleriyle uğraşan matematikçilerin yaptığı da budur. Bant sınırlı sinyalleri çok boyutlu bir "sinyal uzayı" veya "fonksiyon uzayı" içindeki noktalara eşlemek ve geometrik yöntemler kullanarak sinyaller hakkındaki teoremleri kanıtlamak oldukça yaygındır.
Sinyallerin çok boyutlu bir sinyal uzayında veya fonksiyonlar uzayında noktalar olarak fikri şüphesiz değerlidir, çünkü matematikçilerin tüm bant sınırlı sinyaller veya bu tür sinyallerin büyük sınıfları için geçerli olan konumları dikkate almadan öne sürmelerine izin verir. her sinyal ayrı Bu, matematikçilerin tüm üçgenler için veya tüm düzgün üçgenler için geçerli olan konumlar ileri sürebilmelerine eşdeğerdir . Sinyaller uzayı, yetenekli matematikçilerin elinde güçlü bir araçtır. Merak etmek ve hayran olmak bize kaldı.
açısından bu bölümün ana konusu, gürültülü sürekli bir kanal hakkındaki önemli bir teoremin ispatıdır. Sonuç, formül (9.3) ile ifade edilir. Bu formül, ikili basamakların, W bant genişliğine sahip bir sinyalin bulunduğu sürekli bir kanal üzerinden ihmal edilebilir bir hata oranıyla iletilebileceği hızı verir. ve güç P W bant genişliğine sahip beyaz Gauss gürültüsüyle karıştırılmış ve güç N.
1928'de Nyquist, W bant genişliğine sahip bir kanal üzerinden bunu zaten biliyordu . 2W gönderebilir ama sinyal gücünün gürültü gücüne belirli bir oranını elde etmek için saniyede kaç farklı simgenin gönderilebileceğini bilmiyordu. Bunu belirli bir durum için, normal tipteki gürültü için bulduk. Ayrıca, örnek başına bazı ortalama m karakter sayısını iletmek mümkünken , bunu ardışık karakterleri bağımsız olarak kodlayarak yapmanın mümkün olmadığını da biliyoruz. Bunun yerine, blok kodlama kullanmanız ve çok sayıda ardışık karakteri aynı anda kodlamanız gerekir.
Formül (9.3) 'ten, küçük bir bant genişliğine ve büyük bir sinyal-gürültü güç oranına sahip mesajları iletmek için büyük bir bant genişliğine ve küçük bir sinyal-gürültü güç oranına sahip bir sinyal kullanmanın mümkün olduğu görülebilir. Bir örnek, frekans modülasyonudur. Bölüm 10'da bunun hakkında daha fazla konuşacağız .
Bu bölümden öğrenilecek daha çok şey var. Bilgi teorisi problemlerinden birini çözmek için yeni bir bakış açısının nasıl kullanıldığını ve matematiğin güçlü alanlarından birinin nasıl uygulandığını gösterdik. İfade (9.3), çok boyutlu uzayın noktalarıyla üzerlerine gürültü bindirilmiş uzun elektrik sinyallerini "hiçbir şekilde bariz olmayan" görüntüleme yöntemi kullanılarak elde edilir. Bir noktanın orijine olan uzaklığının karesi, bu noktanın gösterdiği sinyalin enerjisi olarak yorumlanmıştır.
Böylece bilgi teorisi problemi geometrik bir probleme indirgenmiş ve geometrik muhakeme kullanılarak istenilen sonuca ulaşılmıştır. Sinyallerin geometrik temsilinin, sinyallerin iletimini ve özelliklerini incelemek için güçlü bir matematiksel araç haline geldiğini belirtmiştik.
Sinyal probleminin geometriye indirgenmesi başlı başına ilgi çekici olmakla birlikte, teknolojinin sürekli artan karmaşıklığının ortaya koyduğu problemlerin çözümü için yeni matematiksel yollar aramanın ne kadar önemli olduğunun bir örneği olarak da ilgi çekicidir. Ancak bu yolu izleyerek sürekli artan zorlukları çözmeyi umabiliriz.
Onuncu Bölüm
BİLGİ TEORİSİ
FİZİK
2. bölümde bilgi teorisinin tarihinden zaten bahsetmiştim. Orada telekomünikasyondan çıktığını gördük ve elektrik akımının, elektrik ve manyetik alanların özelliklerinin fiziğin dallarından biri olduğunu öğrendik.
Morse ve çağdaşları için iletişim araçlarının seçimi, yazılı ve sözlü konuşma olanaklarına kıyasla çok mütevazıydı. Elektrik akımını art arda açıp kapatarak alfabenin harflerini göstermelerini sağlayacak kodlar bulmaları gerekiyordu . İletilen materyali çeşitli elektrik sinyalleri kullanarak görüntüleme sorunu, matematiksel iletişim teorisi için çok önemli olan kodlamaya ilişkin en genel fikirlerin ortaya çıkmasına yol açtı. Kodlama ve bazı fiziksel fenomenler arasındaki bu ilişkide, bilgi teorisi ve fizik arasında doğrudan bir bağlantı görüyoruz.
Sinyallerin tel veya radyo ile iletilmesinde, alınan sinyallerin üzerine kaçınılmaz olarak gürültü dediğimiz parazitin bindirildiğini de belirtmiştik . Bazı durumlarda, bu gürültü azaltılabilir. Dikkatli tasarım ve her türlü ustaca cihaz, alıcı aparat tarafından yaratılan girişimi en aza indirebilir. Örneğin, radyo sinyallerini alırken, vericinin yanından gelen sinyallere duyarlı ve diğer yönlerden gelen sinyallere daha az duyarlı bir anten kullanabilirsiniz. Ayrıca alıcımızın sadece almak istediğimiz frekanslara yanıt vermesini sağlayabilir ve diğer frekanslardaki parazitleri ve parazitleri azaltabiliriz.
Yine de, tüm bunlar yapıldığında bile, bir miktar gürültü kalır ve alınan sinyalin üzerine bindirilir. Bu sesler, araba ateşleme sistemlerinden kaynaklanan parazitleri içerir. Yapay kaynaklardan uzakta, yıldırım deşarjlarının bir sonucu olarak girişim meydana gelebilir. Ancak şimşeğin etkisini ortadan kaldırmak mümkün olsa bile, termal hareket nedeniyle yine de gürültü olacaktır.
Yıllar önce, İngiliz biyolog Brown, mikroskobunda bir sıvı içinde asılı duran küçük polen parçacıklarının tuhaf bir dansını gördü. Bu parçacıklar önce bir yönde, sonra başka bir yönde, bazen hızlı, bazen yavaş hareket ediyorlardı. Bu olguya Brownian hareketi adı verilmiştir . Çevredeki moleküllerin polen parçacıkları üzerindeki etkilerinden kaynaklanır ve moleküllerin kendileri daha da vahşi danslar yaparlar. Bu arada, Einstein'ın ilk büyük eserlerinden biri, Brown hareketinin matematiksel çalışmasına ayrılmıştı.
Brown'ın hareket ettiğini gözlemlediği polen parçacıkları, etraflarındaki moleküller durağan olsaydı, hareketsiz kalırlardı, ancak moleküller her zaman kaotik hareket halindedir. Isının özünü oluşturan bu kaotik harekettir. Bir gaz molekülü, diğer moleküllerle sık çarpışmalar sonucu keyfi olarak hareket yönünü ve hızını değiştirir. Sıvı moleküllerin yoğun bir dizi diğer molekülü itmesi daha zordur, ancak aynı zamanda daha hızlı veya daha yavaş hareket ederek konumlarını sürekli değiştirirler. Katı bir cismin molekülleri, belirli bir ortalama konum etrafında, bazen büyük, bazen küçük bir genlikle salınır, ancak asla en yakın komşularından büyük bir mesafe kat etmezler. Bununla birlikte, her yerde - bir gazda, bir sıvıda ve bir katıda - ısı nedeniyle moleküller, mutlak sıcaklıkla orantılı belirli bir ortalama enerji ile hareket eder, ancak hız ve enerji zaman içinde ve molekülden moleküle keyfi olarak değişebilir.
Mekanik hareketin enerjisi, evrendeki tek enerji biçimi değildir. Radyo dalgaları ve ışık dalgaları gibi elektromanyetik dalgaların da enerjisi vardır. Elektromanyetik dalgalar, elektrik akımının büyüklüğündeki bir değişikliğin sonucu olarak ortaya çıkar. Moleküller atomlardan oluşur ve atomlar da pozitif yüklü bir çekirdekten ve bu çekirdeği çevreleyen negatif yüklü elektronlardan oluşur. Bir maddenin moleküllerinin termal titreşimleri sırasında, moleküllerde bulunan yüklerin göreli hareketi, hem radyo frekansı dalgaları hem de termal dalgalar ve ışık dalgaları olmak üzere çeşitli frekanslarda elektromanyetik dalgalar oluşturabilir. Genellikle ısıtılmış bir cismin elektromanyetik dalgalar yaydığı söylenir ve bu elektromanyetik dalgaların kendilerine radyasyon denir . H
Aynı sıcaklığa sahip farklı cisimlerin radyasyon yoğunluğu aynı değildir. Karanlık nesneler, açık renkli nesnelere göre daha iyi yayar. Bu nedenle, parlak yüzeyi üzerine gelen radyo dalgalarının, ısı ve ışık dalgalarının çoğunu yansıtan bir gümüş para zayıf bir yayıcı iken, karkastaki kömür parçacıkları iyi bir yayıcıdır.
Bir nesneden yansıyan radyasyonun farklı frekanslarda (radyo frekanslarında ve ışık radyasyonunun frekanslarında) emilene oranı farklıdır. Bununla birlikte, belirli bir frekanstaki radyasyon için genel bir kural vardır: belirli bir sıcaklıkta bir nesne tarafından yayılan radyasyon miktarı, emilen radyasyon miktarı ile doğru orantılıdır. Sanki her cismin etrafında, üzerine gelen radyasyonun belli bir kısmını geçiren ve geri kalanını yansıtan bir kabuk varmış gibi ve kabuktan cisme giren radyasyon miktarı, cismin yaydığı radyasyon miktarına eşitmiş gibi oluyor. .
Eğer böyle olmasaydı, o zaman tuhaf ve doğal olmayan (ve doğa yasalarını bildiğimiz için neyin doğal olduğunu biliyoruz) fenomenler beklenebilirdi. Her tarafı kapalı bir kutu veya içinde sabit bir sıcaklığın korunduğu bir fırın düşünün. Ve bu fırının içinde iki cismin asılı olduğunu varsayalım. Ayrıca (gerçeklerin aksine) birinci cismin radyasyonu iyi yansıttığını ve zayıf bir şekilde emdiğini, ancak radyasyonu iyi yaydığını varsayalım. İkinci cisim radyasyonu iyi emer, zayıf yansıtır ve radyasyonu zayıf yayar. İlk anda her iki cismin de aynı sıcaklığa sahip olmasına izin verin. O zaman, varsayımlarımıza göre, birinci cisim ikinci cisimden daha az soğurmalı ve daha fazla radyasyon yaymalı, bu cisim de birinci cisimden daha fazla soğurmalı ve daha az radyasyon yaymalıdır. Durum böyle olsaydı, ikinci cisim birinciden daha sıcak olurdu.
Ancak bu olmaz. Her tarafı kapalı bir kutuya veya duvarları sabit ve tüm duvarlar için aynı sıcaklıkta tutulan bir fırına yerleştirilen hem koyu hem de parlak herhangi bir vücut, duvarlarla tam olarak aynı sıcaklığı elde eder. Bu, ancak doğada gözlenen radyasyonu emme ve yayma yetenekleri yakından ilişkiliyse gerçekleşebilir.
Kapalı bir fırının içinde, tüm cisimler yalnızca aynı sıcaklıkta değildir, ayrıca belirli bir fırının oldukça kesin bir yoğunluk özelliği olan radyasyon da vardır. Radyasyonun fırının içindeki duvarlardan birine düşen kısmına ne olduğunu düşünelim. Bu radyasyonun bir kısmı geri yansıtılır ve fırının içinde kalır. Radyasyonun bir kısmı duvar tarafından emilir. Buna karşılık duvar, kendisinden yansıyan radyasyona eklenen radyasyon yayar. Böylece fırının iç hacmi ile duvarlar arasında sürekli bir radyasyon alışverişi olur.
Fırının içindeki radyasyon çok zayıf olsaydı, duvarlar emdiğinden daha fazla radyasyon yayardı. Fırının içindeki radyasyon çok güçlü olsaydı, duvarlar yaydıklarından daha fazlasını emerdi. Duvarların yaydığı elektromanyetik radyasyon miktarı, duvarların emdiği radyasyon miktarına tam olarak eşit olduğunda, radyasyonun çevre ile dengede olduğu söylenir. Tıpkı bir gaz, sıvı veya katı moleküllerinin hareket enerjisinin sıcaklık arttıkça artması gibi, radyasyon enerjisi de sıcaklıkla artar.
Fırın içindeki radyasyonun yoğunluğu, duvarların radyasyonu emme veya yansıtma yeteneğine bağlı değildir, sadece duvarların sıcaklığına bağlıdır. Durum böyle olmasaydı, bir radyasyon akısı parlak, iyi yansıtan duvarlara sahip bir fırından küçük bir delikten karanlık, iyi emen duvarlara sahip bir fırına geçerdi (fırınların sıcaklığının aynı olması şartıyla). Ve bu asla olmaz.
Bu nedenle, belirli bir sıcaklığın, ışık, kızılötesi ışınlar ve radyo dalgaları gibi iyi tanımlanmış bir elektromanyetik radyasyon yoğunluğu ile karakterize edildiği açıktır. Artık elektromanyetik dalgaların yalnızca vakum, hava veya yalıtkan maddelerden (örneğin cam) geçemeyeceğini, aynı zamanda tellerden de iletilebileceğini not ediyoruz. Aslında, iki telefon kablosu boyunca gönderilen bir sinyal, ya teller arasındaki bir voltaj ve teller boyunca akan bir elektron akışı olarak veya teller arasındaki bir elektrik alanı ve tellerin etrafındaki bir manyetik alandan oluşan bir dalga olarak anlaşılabilir. akımla aynı anda tel boyunca hareket etmek. Tellerdeki elektrik sinyallerini elektromanyetik dalgalarla tanımlama yeteneği ve ısıtılmış cisimlerin elektromanyetik dalgaları yayma kabiliyeti olan iki gerçeği karşılaştırarak, ısının bir tür elektrik sinyali üretmesi beklenebilir. Isının ürettiği elektriksel dalgalanmaları keşfeden Johnson, bu dalgalanmaları elektromanyetik dalgalar olarak değil, direnç üzerinde oluşan voltaj dalgalanmaları olarak tanımladı.
Johnson bu dalgalanmaları tespit edip ölçebildikten sonra, istatistiksel mekaniğin ilkelerini uygulayan başka bir fizikçi, büyüklükleri için kesin bir matematiksel ifade bulabildi. Bu fizikçi, 2. Bölüm'de gördüğümüz gibi, bilgi kuramının temeline önemli katkılarda bulunan Nyquist'ten başkası değildi .
Termal gürültü (veya Johnson gürültüsü) dediğimiz şeyin Nyquist ifadesi şu şekildedir:
V ben = ΛkTRW. (10.1)
Burada V 2 - Gürültü voltajının RMS değeri, yani direnç boyunca gürültü voltajının karesinin ortalama değeri /?; k - Boltzmann sabiti (⅛ = 1,37 23 ־10 ״ jіgrad) -, T - mutlak sıfırdan sayılan Santigrat derece cinsinden sıcaklığa eşit Kelvin cinsinden direnç sıcaklığı (mutlak sıfır, -273 ° Santigrattır); R , ohm cinsinden ölçülen dirençtir ; W hertz cinsinden gürültü bant genişliğidir.
Açıkçası, bant genişliği W sadece ölçüm araçlarımızın özelliklerine bağlıdır. Gürültü geniş bantlı bir amplifikatörle güçlendirilirse, bu amplifikatörün çıkışındaki gürültü, aynı kazanca sahip dar bantlı bir amplifikatörle gürültünün yükseltildiği duruma göre daha büyük olacaktır. Dolayısıyla, bant genişliği birkaç megahertz olan bir televizyon alıcısında, bant genişliği birkaç kilohertz olan bir radyo alıcısından daha fazla gürültü beklenebilir.
Isıtılmış bir direnç boyunca bir gürültü voltajının oluştuğunu gördük. Isıtılmış rezistansa başka bir direnç bağlanırsa, elektrik gücü birinciden ikinci rezistansa akar. İkinci direnç soğuksa, bu işlem sonucunda ısınır. Bu nedenle, ısıtılmış bir direnç potansiyel bir gürültü kaynağıdır. Maksimum gürültü gücü N nedir , Direnç tarafından verilen? Bu güç eşittir
N=kTW. (10.2)
(10.2) kullanmak ifadeyi (10.1) kullanmaktan daha uygundur . Birincisi, formül (10.2) daha basittir - içinde /? direnci yoktur; ikincisi, çok çeşitli durumlarda uygulanabilir.
Örneğin, büyük parabolik yansıtıcısı odaklanan bir radyo teleskopumuz olduğunu varsayalım.
Resim. 10.1.
radyo dalgaları gönderir ve bunları hassas bir radyo alıcısına gönderir (Şekil 10.1). Çeşitli göksel veya karasal nesnelere bir radyo teleskopu doğrultalım ve sıcaklıklarına karşılık gelen, onlar tarafından yayılan elektromanyetik gürültüyü alalım.
(10.2) ile belirleneceğini bulacağız , burada T radyo teleskopunun yönlendirildiği nesnenin sıcaklığıdır.
Teleskopu suya veya pürüzsüz bir yüzeye doğrulttuğumuz takdirde, üzerinde gördüğümüz şey aslında gökyüzünün bir yansıması olacaktır, ancak teleskopu ağaç yaprakları veya çalılar gibi neredeyse radyo dalgalarını yansıtmayan nesnelere doğrulttuğumuz takdirde, o zaman yaklaşık 290° K sıcaklığa, yani ağaçların sıcaklığına karşılık gelen gürültü alırız . Bir radyo teleskopu Ay'a, yalnızca Ay görünecek şekilde yönlendirilirse ve ayın etrafındaki boşluk teleskopun görüş alanına girmezse, alınan gürültü Ay'ın yüzeyinin sıcaklığına değil, Ay'ın maddesi radyo dalgalarına oldukça şeffaf olduğundan, birkaç santimetre derinlikteki sıcaklığa
Bir teleskop Güneş'e doğrultulduğunda alınan gürültü miktarı, radyonun ayarlandığı frekansa bağlı olacaktır. Alıcıyı yaklaşık 10 MHz'lik (dalga boyu 30 m) bir frekansa ayarlarsanız , alınan gürültü yaklaşık 1.000.000 o sıcaklığa karşılık gelir. K, seyreltilmiş güneş koronasının sıcaklığıdır. Dünya atmosferi gibi, güneş tacı da daha kısa radyo dalgalarına karşı şeffaftır. Bu nedenle, alıcı yaklaşık 10.000 MHz'lik bir frekansa ayarlanmışsa , alınan radyasyon yaklaşık 8.000 ° K'lik bir sıcaklığa, güneşin yüzey sıcaklığının biraz üzerinde bir sıcaklığa karşılık gelecektir. Ancak koronanın sıcaklığının neden Güneş'in görünür yüzeyinin sıcaklığından çok daha yüksek olduğu bilinmiyor?
Farklı frekanslardaki uzay radyotümörü farklıdır. Birkaç bin megahertz'in biraz üzerindeki frekanslarda, gürültü 2 ila 4 o'luk bir sıcaklığa karşılık gelir. K. Düşük frekanslarda gürültü daha fazladır, azalan frekansla monoton olarak artar. Samanyolu, bazı yıldızlar ve Evrenin çarpışan "adaları" - galaksiler tarafından yayılan gürültü seviyesi yüksektir. Dış uzayın tek bir sıcaklığı yoktur, bu nedenle formül (10.2) kullanılarak uzaydan gelen gürültüyü hesaplamak imkansızdır .
Ancak her koşulda, Johnson gürültüsü veya termal gürültü, en azından kesin olarak kabul edeceğiz. Ek gürültü kaynakları yalnızca işleri daha da kötüleştirir. Termal gürültünün doğasının, radyo alıcılarının özelliklerini ölçmek için bir standart olarak kullanılmasına yol açtığı belirtilmelidir.
Daha önce belirtildiği gibi, radyo alıcısı alınan sinyallere kendi sesini ekler. Ek olarak, aldığı herhangi bir gürültüyü yükseltir. Şu soru sorulabilir: Isıl gürültü, alıcının kendi gürültüsüne eşit olması için kaç kez yükseltilmelidir? Alıcının içsel gürültüsünü, eşdeğer gürültü sıcaklığı Tn cinsinden ifade etmek mümkündür . Eşdeğer gürültü sıcaklığı T n bir radyo alıcısının gürültü özelliklerinin bir ölçüsüdür . G l ne kadar küçükse , alıcı o kadar iyidir. Gürültü sıcaklığı T n aşağıdaki gibi yorumlanabilir. Gerçek alıcıyla aynı kazanç ve aynı bant genişliğine sahip ideal, gürültüsüz bir alıcımız olduğunu varsayalım. T n1 sıcaklığına karşılık gelen termal gürültüyü ekleyelim alınan sinyale, o zaman girişinde termal gürültüye sahip bir sinyalin bindirildiği ideal bir alıcının çıkışındaki sinyal gücünün gürültü gücüne oranı, sinyal gücünün sinyal gücüne oranına eşit olacaktır. girişinde aynı sinyalin uygulandığı, ancak üzerine termal gürültü bindirilmemiş gerçek bir alıcının çıkışındaki gürültü gücü.
Böylece, eşdeğer gürültü sıcaklığı T n bir alıcının gürültü özelliklerinin doğru bir ölçüsüdür . Bazen T n değeri başka bir önlemi tanıtmak için kullanılır
Formül (10.3) , her sinyalin yaklaşık 293 o K'lik bir sıcaklığa karşılık gelen gürültü ile karıştırıldığı, yalnızca karasal koşullarda kullanım için tasarlanmıştır. Gürültü faktörü, girişteki termal gürültüden kaynaklanan toplam çıkış gürültüsünün oranıdır. 293 o sıcaklık K ve alıcının içsel gürültüsü, k cihazın çıkışındaki termal gürültü bileşeni.
Eşdeğer gürültü sıcaklığı T n1 Tabii ki, radyo alıcısının kalitesine bağlıdır ve gürültü faktörünün elde edilebilecek en düşük değeri de çalışma frekansına bağlıdır. Çeşitli türlerdeki alıcıların kalitesi hakkında bazı fikirler Tablodan elde edilebilir. 14.
Bilgi teorisinde, radyo alıcısının etkin sıcaklığının ve anteninin yönlendirildiği nesnelerin etkin sıcaklığının etkisini hesaba katmak çok önemlidir, çünkü mesajı iletmek için gereken gücü gürültü belirler. Termal gürültü Gauss
Tablo 14
(9.3) ona uygulanır . Böylece, ideal olarak, C'yi geçmek bit/saniye, P gücüne sahip bir sinyale sahip olmanız gerekir ve bu güç, sis gücü N ile ilgilidir. ilişki (9.3), önceki bölümde türetilen, sayfa 207):
C = JP Günlüğü
N'nin değerini yerine koyarsak formül (10.2)'den , o zaman şunu elde ederiz:
C=B40g(l+⅛ r ). (10.4)
Sinyal gücü P olsun. W'nin değeri çok küçük alınırsa, o zaman C çok az olacak. W yaparsak C'den daha fazla süresiz olarak artmayacak, ancak bazı sınırlayıcı değerlere yönelecektir. PIkTW ise birlikten çok daha az, o zaman formül (10.4) şu şekle sahip olacaktır:
C = 1⅛L. (10.5)
Bu, şu şekilde de yazılabilir:
P = 0.693⅛TC. (10.6)
İlişki (10.6), çok geniş bir bant genişliğinde bile, saniyede bir bit iletiminin yine de en az 0.693 kT jsn'lik bir güç gerektireceğini ve ortalama olarak her bir bilgi bitinin 0.693 kT j'lik bir enerji gerektirdiğini göstermektedir. Formül (9.3)' ün sadece ideal kodlama türü olan blok kodlama için geçerli olduğunu da unutmamalıyız . Bölüm 9'da belirtildiği gibi , çoğu pratik iletişim sistemi, bilgi biti başına çok daha fazla güç gerektirir.
(10.6) ifadesinin bazı sıra dışı iletişim sistemleri için ne kadar değerli olduğunu görelim . Diyelim ki Mars yakınlarında bir uzay gemisindeyiz ve Dünya'ya İngilizce bir metin göndermek istiyoruz. İdeal olarak, bu, harf başına yaklaşık bir ikili karakter veya kelime başına 5,5 ikili basamak olacaktır . Bu metni geleneksel bir teletip hızında, yani dakikada 60 kelime (veya saniyede bir kelime) göndermek istiyorsak, o zaman nhM'nin saniyede 5,5 ikili basamak göndermesi gerekir , yani bu tam olarak eşit olacak değerdir ila C, kanal kapasitesidir .
Alıcımıza ulaşan sinyal soğuk uzaydan geliyorsa, o zaman sadece uzayın sıcaklığından kaynaklanan kaçınılmaz gürültü üzerine binecektir. Çalışma frekansı birkaç bin megahertz mertebesindeyse, bu sıcaklık yaklaşık 4° K'ye eşit olarak ayarlanabilir . (10.6)' ifadesine giren tüm nicelikler bilindiğinden (C = 5.5 ve T = 4), o zaman alınan P r sinyalinin gerekli gücünü hesaplayabilirsiniz . O eşit olur
P b = 2 • ИО 22 ־ Salı.
Elbette, iletilen gücün tamamı alıcı anten tarafından alınmadığı için bundan çok daha fazla güç iletmek zorundayız. İletilen gücün her yöne eşit olarak yayıldığı durumu düşünün. L mesafesinde vericiden, bu güç L yarıçaplı bir küre üzerine eşit olarak dağıtılacaktır. 4πL 2 yüzeyi ile . Alıcı antenin çapı D ve alanı πZ) 2 ∕4 olan içbükey bir parabolik yansıtıcı olduğunu varsayalım . O zaman iletilen gücün oranı P t alma gücüne P r eşit olacak
== _ 16 (107)
P r nD*∕4 1υ <Z>√'
50.000.000 km veya 5• IO 10 uzaklıkta olduğunu varsayalım. m, Dünya'dan. Çapın D olduğunu varsayalım alıcı anten 50 m'ye eşit olacaktır , o zaman iletilen gücün alınan güce oranı eşittir
⅛-=l,6∙10 w .
Pr
P b = olduğundan 2• ІО“ 22 W, o zaman iletilen güç yaklaşık olarak şuna eşit olmalıdır:
Nokta == 0,003 W.
50 m çapında bir alıcı anten kullanarak , Mars'a yakın olduğumuzdan , İngilizce bir metni Dünya'ya dakikada 60 kelime hızında iletebiliriz . Bunu yapmak için, gücü yalnızca bir watt'ın binde üçü kadar olan bir vericiye ihtiyacımız olacak!
Ve gerçek bir durumda hangi güç gerekli olacaktır? Metni, en basit ve en yaygın _ harfi yöntemini kullanarak, her harf için 5 ikili basamak kullanarak kodlarsak , o zaman gerekli gücü 5 kat artırmamız gerekir . En iyi bilinen alıcıyı, 20° gürültü sıcaklığına sahip ( dış uzayın gürültü sıcaklığından 5 kat daha yüksek olan ) bir maser alırsak , gerekli güç 5 kat daha artacaktır. İkili rakamlar birer birer iletilirse, verici sırayla açılıp kapatılırsa, bu modülasyon veya kodlama yönteminin verimsizliği nedeniyle, gücün bir kez daha 40 artırılması gerekir. Böylece, gerçek bir sistemde , idealden 1000 kat daha büyük bir güç , yani 3 watt. Hy ve bir maser alıcıya başvurmazsanız, gücü 10 kat daha artırmanız ve 30 watt'a çıkarmanız gerekir .
Dünya'dan 50.000.000 km uzaklıkta bulunan bir uzay aracından bir mesaj almak istediğimizi varsayalım . Antenin yönlülüğünün, yalnızca uzay aracını ve Güneş'i "görecek" olduğunu varsayalım. Güneşin sıcaklığı, uzayın sıcaklığından yaklaşık 2000 kat daha yüksektir, bu nedenle ideal durumda bile, yaklaşık 6 watt ve pratikte birkaç yüz watt gerekli olacaktır .
Tabii ki, gerçek bir gezegenler arası sistemde, uzay aracına büyük bir dış mekan yönlü anten yerleştirirdik. Daha sonra güç, dar bir ışında Dünya'ya iletilirdi. Bu, yukarıda hesaplanan gücü 10.000 kat , hatta 1.000.000 kat azaltacaktır . Dolayısıyla, bu koşullar altında, Mars ve Dünya arasında bir televizyon yayını bile mümkün olabilirdi, keşke Haritalar'a bir televizyon yerleştirmesi atabilseydik !
Bu örneği, esasen bana çok açık ve ilginç göründüğü için ve ayrıca bu gibi durumlarda gücü azaltmanın ne ölçüde mümkün olduğunu bilmek özellikle önemli olduğu için verdim. Uzak uzay uçuşlarında, gerekli enerjinin büyük bir kaynağı ve güçlü bir radyo vericisi, büyük harcamalar gerektirecektir.
Yukarıdaki örnek, fizik yasalarının önümüze koyduğu engelleri ve mevcut kodlama sistemleri ve mevcut alıcılar kullanılarak neler yapılabileceğini göstermektedir. Uzay araştırmaları ve belki de uzay yolculuğu çağında, doğanın izin verdiği iletişim verimliliği ve ekonomisi sınırına ulaşmaya çalışmak mantıklı olacaktır.
Şimdi fizik yasalarının bağlantı kurma olasılığına getirdiği başka bir sınırlamaya dönelim. Elektromanyetik dalgaların sadece uzayda serbestçe hareket edemeyeceklerini, ayrıca teller aracılığıyla da yayılabileceğini daha önce söylemiştik. Elektromanyetik dalgalar , dalga kılavuzunun çapının dalga boyunun en az iki katı olması koşuluyla, dalga kılavuzları aracılığıyla da iletilebilir .
dalga türü (mod) bulunabilir, yani boyunca yayılabilir . İdeal olarak, her türden bir dalga, diğer dalgalardan bağımsız olarak ve onlarla etkileşime girmeden yayılabilir. Bu nedenle, bu bağımsız dalga türlerini kullanarak, aynı frekans aralığında çok sayıda bağımsız mesaj iletebiliriz.
Ancak bu olasılık pratik olarak çok küçüktür, çünkü tasarım kusurları kaçınılmaz olarak çeşitli türlerdeki dalgaların etkileşimini gerektirir. Genel olarak, pratikte, elektromanyetik enerjinin en az zayıflamayla, yani en az güç kaybıyla iletilmesine izin veren dalga türlerinin kullanılması en iyisidir ve diğer dalga türlerinden kurtulmak istenir.
Bununla birlikte, çeşitli türlerde çok sayıda dalganın varlığı, bazı teorik önermeleri açıklamak için önemlidir. Çok kısa elektromanyetik dalgaların dalga kılavuzu boyunca hareket ettiğini hayal edelim ve dalga kılavuzunun üzerine, "aydınlık" kısmı elektromanyetik dalgaları serbestçe iletecek ve "karanlık" olan belirli bir kısmı emecek şekilde yapılmış bir model yerleştirildiğini varsayalım. fraksiyon elektromanyetik enerji. Desenden yeterli bir mesafede çeşitli türlerdeki dalgaların yoğunluğunun, onun aydınlık ve karanlık kısımlarının bir yansıması olduğu gösterilebilir.
Işığı saydam bir nesneden geçirerek, daha önce de belirtildiği gibi, her biri yarı saydam nesne hakkında bazı bilgiler taşıyan çeşitli türlerde karmaşık bir elektromanyetik dalga sistemi yaratırız. Bu nedenle, belirli bir frekansta veya belirli bir dalga boyunda ışık kullanılarak bir nesnenin görüntüsünün oluşturulması, her iletişim kanalının dalga türlerinden biri olduğu bir dizi bağımsız iletişim kanalı kullanılarak bilgi iletimi olarak temsil edilebilir. Bu konu zaten bir dereceye kadar araştırıldı.
Ancak burada bir zorlukla karşılaşıyoruz. Termal sis (10.1) ve (10.2) için ifadeler , klasik veya başka bir deyişle kuantum öncesi teorinin formülleridir. Radyo dalgaları göz önüne alındığında , çoğu durumda bu ifadeler oldukça doğru bir şekilde yerine getirilir, ancak 500.000.000 MHz mertebesinde frekanslara sahip ışık dalgaları düşünüldüğünde yanlış olurlar.
Mesele şu ki, radyasyon küçük porsiyonlar veya kuantumlar halinde gelir. Her kuantumun enerjisi vardır
E-hf. (10.8)
/ frekans (hertz cinsinden) ve h Planck sabiti şuna eşittir:
⅛ \ u003d 6.63• GÇ " 34 j/sn.
hf olduğunda kuantum etkileri dikkate alınmalıdır. kT ile karşılaştırılabilir veya daha büyük hale gelir . Yani, f 1 frekansı üzerinde klasik ifadelerimizin açıkça hatalı olacağı, eşittir
' г / ־־'
/=≈ 2.07• IO 10 T. (10.9)
3 o sıcaklıkta Bu frekans yaklaşık olarak 60.000 MHz'e eşittir , bu da 0,5 cm'lik bir dalga boyuna karşılık gelir ve santimetre aralığına aittir. 300 o sıcaklıkta K (oda sıcaklığı) bu frekans 6.000.000 MHz'dir, bu da 0.005 cm'lik bir dalga boyuna karşılık gelir ve kızılötesi spektruma aittir. Görünür ışığın frekansı yaklaşık 500.000.000 MHz'dir, bu da 6 •IO 5 ־־ dalga boyuna karşılık gelir santimetre.
Kuantum etkileri İletişime hangi kısıtlamaları getirir? Bu sorunun kesin cevabını bilmiyoruz. Bilgi teorisinin modern biçiminin doğuşundan bugüne kadar epeyce yıl geçmesine rağmen, fizikçiler bu temel soruya henüz tam bir cevap veremediler. Ama yine de bir şeyler söylenebilir.
Klasik bir bakış açısından, bir sinyal, ne kadar zayıf olursa olsun, sürekli değişen bir akım, gerilim, elektrik veya manyetik alan olarak kabul edilebilir . Sinyal, termal gürültü tarafından bozulur ve bu gürültünün kendisi, klasik bakış açısından, sürekli değişen bir sinyalin üzerine bindirilmiş sürekli değişen, öngörülemeyen bir niceliktir.
Kuantum teorisine göre sinyal, gürültü ile karışmasa bile bir dereceye kadar tahmin edilemez. Bu nedenle, bir kuantumdan daha az, yani hf değerinden daha az enerji gönderemeyiz . Bir kuantum gönderdiğimizde, aynı anda hem frekansını hem de alıcıya ulaşacağı zamanı yeterli doğrulukla belirleyemeyiz. Bu önerme, Heisenberg'in belirsizlik ilkesinden gelmektedir. Kuantum etkilerini göz önünde bulundururken uğraşmamız gereken gürültü türlerinden biri, sinyal üzerine bindirilen termal kökenli kuantadır. Bu gürültü, klasik termal gürültüye karşılık gelir. Bununla birlikte, gürültü kuantumları olmasa bile, alınan sinyal hakkında hala bazı belirsizlikler olduğunu görüyoruz, oysa klasik durumda durum böyle değil.
Artık kuantum etkilerinin iletişime getirdiği sınırlamalarla ilgili birkaç soruyu yanıtlayabiliriz. Örneğin, bir bitlik bilgiyi iletmek için kaç tane kuantuma ihtiyaç vardır? Tüm arzumuzla, tam olarak bir kuantum gönderemememize ve birkaç değil, tam olarak bir kuantumun gönderildiğinden tamamen emin olmamıza rağmen, termal gürültü miktarının araya girmesi olmadığında ortalama olarak bir kişinin yapabileceği ortaya çıktı. , yeterince uzun süre yapmak için, kuantum başına sınırsız sayıda ortalama bit taşır. Örneğin, her bir kuantumu çok sayıdaki zaman aralığından birinde veya çok sayıda frekanstan birinde göndermeye çalışmak mümkündür, böylece her bir kuantumun iletim yöntemini seçme olasılıkları artar. İletim sırasında kuantum belirsizliği nedeniyle hatalar meydana gelse bile, alınan mesajın bozulmasını önlemek için karmaşık kodlama teknikleri kullanılabilir.
Bir bitlik bilgiyi iletmek için gereken ortalama gücün ne olduğu da sorulabilir. Yine, çıkıntı yapan nicem yoksa, yukarıdaki yöntemlerden biri kullanılarak çok sayıda bilgi biti içeren nicem gönderilerek veya düşük frekanslar kullanılarak bu güç istenildiği kadar küçük yapılabilir. enerji düşüktür. Aslında, sinyal iletimi için çok düşük frekanslar kullanılıyorsa (yani iletim hızı sınırlıdır), o zaman (10.6) ifadesi hem kuantum hem de klasik teorilerde geçerli olacaktır, çünkü düşük frekanslarda kuantum özellikleri klasik olanlara yaklaşır.
Bununla birlikte, gerçek iletişim sistemlerinde, tam olarak kuantum etkilerinin baskın olduğu frekansların kullanılması arzu edilir. Gürültüyle karışık yüksek frekanslı sinyallerdeki kuantum etkilerini hesaba katan kesin formüllerimiz yok. Tam bir kesinlikle, burada işlerin klasik, kuantum olmayan durumdan biraz daha kötü olacağı iddia edilebilir. Ama daha ne kadar kötü, henüz bilinmiyor.
bakıldığında , bilgi kuramı ile fizik arasındaki en ilginç ilişki, fizik yasalarının iletişim yeteneğimize dayattığı kaçınılmaz sınırlamaların değerlendirilmesidir. Bu, esas olarak termal gürültü ve kuantum etkilerinden kaynaklanan sınırlamalarla ilgilidir. Ancak bu, sinyali bozabilen atmosferdeki düzensizliklerin ve iyonosferdeki dalgalanmaların dayattığı sınırlamaları da içermelidir. Bu bozulmalar, gürültünün sinyal üzerinde üst üste binmesinin neden olduğu bozulmalardan tamamen farklı bir yapıya sahiptir. Fizik ve enformasyon kuramı arasındaki bu tür bağlantıya başka birçok örnek verilebilir.
Öte yandan fizikçiler, fizik ve bilgi teorisi arasındaki bağlantı hakkında tamamen farklı bir fikre sahipler ve bilgi teorisinin ortaya koyduğu ana sorunun çözümüyle hiçbir ortak yanı yok - kodlamanın verimliliğine hangi kısıtlamaların getirildiğini bulmak. gürültülü bir kanal üzerinden bilgi iletirken. Fizikçiler , ikinci tür sözde sürekli hareket makinesini yaratmanın imkansızlığını göstermek için bilgi teorisinin fikirlerini kullanmayı öneriyorlar . Genel olarak konuşursak, bu fikir, 1929'da L. Szilard tarafından ortaya atıldığı için, matematiksel iletişim teorisinin modern biçiminde ortaya çıkmasından önce bile ortaya çıktı .
Mucitlerin niyetine göre bir sürekli hareket makinesi sınıfı, enerji yaratmayı mümkün kılmalıdır ve bu, termodinamiğin ilk ilkesi olan enerjinin korunumu yasasıyla çelişir.
Diğer bir sınıf, termal hareketin düzensiz enerjisini veya eşit şekilde ısıtılmış bir cismin radyasyon enerjisini düzenli enerjiye, örneğin bir volanın dönme enerjisine dönüştürmek için tasarlanmış sürekli hareket makinelerinden oluşur. Volanın dönüşü, elbette, bazı gövdeleri soğutacak ve diğerlerini ısıtacak olan bir buzdolabını çalıştırmak için kullanılabilir. Dolayısıyla, bu tür bir sürekli hareket makinesi, herhangi bir ek düzenli enerji olmadan, termal enerjiyi soğuk cisimlerden sıcak cisimlere aktarabilir.
Termodinamiğin ikinci prensibi farklı şekillerde formüle edilebilir: düzenli enerji tüketimi olmadan, ısı soğuk cisimlerden sıcak cisimlere transfer olmaz veya şu şekilde: bir sistemin entropisi asla azalmaz. Dolayısıyla, ikinci türden bir sürekli hareket makinesi, termodinamiğin ikinci ilkesiyle çelişir.
İkinci türden sürekli hareket makinelerinin en ünlü türlerinden biri James Clerk Maxwell tarafından icat edildi. Bu motor, Maxwell'in iblisi adlı kurgusal bir figür tarafından kontrol ediliyor .
Resimde. 10.2 Bu iblisi tasvir ettim. Bir bölmeyle ikiye bölünmüş bir kutuda yaşıyor ve işi kutunun iki yarısı arasındaki kapıyı açıp kapatmak. İblis, yan odada kapıya doğru hareket eden hızlı bir molekül görünce kapıyı açar ve molekülü içeri alır, "odasında" kapıya doğru hareket eden yavaş bir molekül görünce onu serbest bırakır. Bu nedenle, yavaş moleküllerin kendisine nüfuz etmediğini ve hızlı olanların ondan kaçmadığını sıkı bir şekilde izler. Yakında iblisin oturduğu odadaki gaz sadece hızlı moleküllerden oluşacaktır. Buradaki sıcaklık yükselecek ve gazın sadece yavaş moleküllerden oluşacağı bitişik odada düşecek. Maxwell'in iblisi, ısının soğuk bir odadan sıcak bir odaya akmasına neden olur. Resimde nasıl olduğunu gösterdim
iblis bir eliyle kapıyı tutar, diğer eliyle termodinamiğin ikinci yasasına burnunu gösterir.
Maxwell'in iblisi, yine de onunla anlaşmaya karar veren fizikçiler için kırılması zor bir ceviz haline geldi. Maxwell'in iblisine yönelik en ağır itiraz şudur: iblisin yaşadığı ortam termal dengede olduğundan, termal gürültüye yalnızca bir tür rastgele elektromanyetik radyasyon eşlik eder - ışık ve o kadar kaotiktir ki iblis hangi molekülleri göremez kapıya yaklaş.
Maxwell'in iblisinin herhangi bir çeşidini bulabilirsin. Ya bir iblis yerine yaylara bir kapı koyarsanız? Böyle bir kapıya bir taraftan çarpan bir molekül kapıyı açıp geçebilecek, diğer taraftan çarpan bir molekül ise kapıları hiç açamayacak. Sonunda tüm moleküller ve tüm enerji yaylı kapının açıldığı odada yoğunlaşmayacak mı?
Yaylı bir kapıya ilk itiraz, eğer yay güçlüyse molekül kapıyı açamaz, ancak yay zayıfsa moleküllerin ısıl enerjisi kapının çarpmaya devam etmesine ve çoğunun kapanmasına neden olur. zaman açılacaktır. Ayrıca moleküller enerjilerinin bir kısmını kapıyı açmaya harcarlar. Tüm fizikçiler, yaylı kapılar gibi mekanik cihazların kullanımının termodinamiğin ikinci ilkesini sarsamayacağı konusunda hemfikirdi.
Hangi cihazın çalışıp hangisinin çalışmayacağını tartışmak hassas bir konudur. Becerikli bir arkadaşım, dengedeki herhangi bir termal hacmin yalnızca molekülleri değil, aynı zamanda rastgele elektromanyetik radyasyonu da içermesi gerektiğini anlayana kadar makinesiyle beni neredeyse kandırıyordu. Ve yine de basit bir makine var ki, sürtünme olmamasına ve tüm saçmalıklarına rağmen ve ayrıca pratikte kesinlikle imkansız olduğu gerçeğine rağmen, bana bu anlamda teorik olarak imkansız görünmüyor. bu kavramın içine konulan şey, fizik. Bu makine Şekil l'de gösterilmektedir. 10.3.
Makine C silindirinden oluşur ve piston R; aralarında sürtüşme yoktur. Piston sola veya sağa hareket ettikçe küçük kapaklardan p birini kaldırır ve diğerini alçaltır*. Piston bir kapı ile sağlanır D i hangi açıp kapatabilir. Silindirde sadece bir M molekülü vardır.Tüm cihazın sıcaklığı T'dir . Duvarlarla çarpışmalarda molekül ya enerji kazanır ya da kaybeder ve molekülün ortalama enerjisi sıcaklık T ile orantılı olur.
Pistondaki kapı açıkken herhangi bir iş yapmadan pistonu sağa sola hareket ettirebilirsiniz. Kapı açıkken pistonu silindirin ortasına yerleştirerek başlayalım. Pistonu bu konumda sabitleyin, kapıyı kapatın. Ardından molekülün pistonun hangi tarafında bulunduğunu belirleriz. Bunu yaptıktan sonra alt raftan küçük bir ağırlık koyun 5 1 Molekül ile aynı taraftaki kabın üzerine yerleştirin ve pistonu serbest bırakın. Molekülün pistona tekrar tekrar çarpması, sonunda üzerine ağırlık konulan kabın en üst raf S 21'e yükselmesine neden olacaktır. burada bardağın ağırlığını alıp üst rafa koyacağız. Ardından kapıyı tekrar açın, pistonu silindirin ortasına yerleştirin ve tüm işlemi tekrarlayın. Sonunda, alt raftan çok sayıda küçük ağırlık kaldırdığımız ortaya çıktı S i üstte - S 2 . Yani, düzensiz termal enerji iyi bir iş çıkardı!
Yapılan iş miktarı nedir? Ortalama kuvvetin F 1 olduğunu göstermek kolaydır. pistona hangi molekülün bastığı ile eşittir
F = ^-, (10.10)
burada L , pistondan molekülün bulunduğu taraftaki yan duvara olan mesafedir . Molekülün pistonu silindirin merkezinden karşı duvara, yani L mesafesini ikiye katlamasına izin verirsek, o zaman en büyük iş W 1 olur. yapılabilecekler şuna eşit olacaktır:
Wz = 0,693⅞7 ∖ ( 10,11)
Aslında ecj⅛ kaldırma işlemi sırasında yükün ağırlığı değişmez, yapılan iş formül (10.11) ile bulunan sınır değerinden daha az olacaktır. Yani bedava enerji aldığımız ortaya çıktı?
Tam olarak değil! Pistonu silindirin merkezine yerleştirip kapıyı kapattığımızda molekül eşit olasılıkla silindirin herhangi bir yarısında bulunabilir. Ağırlığın terazinin hangi kefesine konması gerektiğini, yani molekülün pistonun hangi tarafında olduğunu bulmak için bir bitlik bilgiye ihtiyaç vardır. Makineyi harekete geçirmek için bu bilgiyi T sıcaklığında sisteme iletmek gerekir. Bir bit bilgiyi T sıcaklığında iletmek için gereken minimum enerji nedir? Bu enerjiyi zaten hesaplamıştık; formül (10.6)' dan tam olarak 0,693 kT j 1'e eşit olduğu , yani tam olarak makinemizin üretebileceği en yüksek enerji olduğu görülebilir . Unutulmamalıdır ki, bu formül, yalnızca sinyal çok düşük frekanslarda, yavaş bir şekilde iletildiğinde, kuantum süreçlerine uygulanabilir. Yani, tüm çıkış gücü
Makinenin gücü, makineye güç sağlamak için gereken bilgileri iletmeye gitti!
Böyle bir makinenin verimliliğinin gerçekte ne kadarına ulaşılabileceğini tartışmak anlamsızdır; önemli olan en iyi durumda bile kendi başımıza kalmamız gerektiğidir.
Basit bir örnekle, matematiksel iletişim teorisinde kullanıldığı anlamda bilgi aktarımının, termal enerjiyi mekanik enerjiye dönüştürmemize izin verdiğini gördük. Böyle bir dönüşümde kullanılan bilgi miktarını ölçen bit , bilgi teorisinde mesajların kaynağının entropisini ölçen bir birimdir. Ve termodinamik entropi, mevcut termal enerjinin ne kadarının mekanik işe dönüştürülebileceğini gösterir. Termodinamikte (ve istatistiksel mekanikte) kullanılan entropi ile bilgi teorisinin entropisi arasında bir bağlantı kurmaya çalışmak doğal görünüyor.
Bilgi teorisindeki entropi, bir kaynağın belirli koşullar altında birçok olası mesajdan hangi mesajı yaratacağı konusundaki belirsizliğin bir ölçüsüdür. Kaynak m eşit olasılığa sahip mesajlardan bir mesaj seçerse, mesaj başına bit cinsinden entropi m'nin 2 tabanlı logaritmasına eşittir ; Bu durumda, bu tür mesajların mesaj başına 1 log m ikili hane ile iletilebileceği açıktır . Daha genel olarak, bilgi teorisinde entropinin önemi , kaynak tarafından üretilen mesajları iletmek için gereken ortalama ikili basamak sayısını söylemesinde yatmaktadır.
İstatistiksel mekanikteki entropi, fiziksel bir sistemin hangi durumda olduğunun belirsizliğini karakterize eder . İstatistiksel mekanikte, aynı toplam enerjiye sahip tüm durumların eşit derecede olası olduğu varsayılır. İstatistiksel mekanikte entropi, Boltzmann sabitinin olası durum sayısının e tabanına göre logaritması ile çarpımına eşittir . Bu entropi istatistiksel mekanikte yaygın olarak kullanılır. Bu entropinin önemli uygulamalarından biri, S. E. ile göstereceğimiz serbest enerji formülüdür.
(10.12)
S.E. = £—
?SG
nerede E — toplam enerji; H entropidir ; T —- sıcaklık ra. Serbest enerji, toplam enerjinin ideal olarak işe, örneğin bir yükü kaldırma işine dönüştürülebilen kısmıdır.
İstatistiksel mekanikte entropinin ne olduğunu anlamak için fiziksel bir sistemin ne olduğunu tanımlamak gerekir. İşte bazı fiziksel sistem örnekleri. Fiziksel sistem kristal bir katı, su ve su buharı içeren kapalı bir kap, gazla dolu bir rezervuar veya başka herhangi bir madde veya maddeler topluluğu olabilir. Böyle bir sistemi dengedeyken, yani tüm sistemde aynı sıcaklık sağlandığında ve bu sıcaklıkta meydana gelebilecek bazı fiziksel veya kimyasal değişimler sona ermişken bazıları henüz başlamamışken inceleyeceğiz.
Belirli bir fiziksel sistem örneği olarak, bir kapta rastgele dolaşan, kaybolacak kadar küçük birçok parçacıktan oluşan ideal bir gazı ele alalım.
durumu, tüm bu parçacıkların konumlarının ve hızlarının (fizik yasalarının izin verdiği ölçüde) tam bir açıklaması olarak anlaşılır. Klasik mekaniğe (Newton'un hareket yasaları) göre, her parçacık herhangi bir hıza ve enerjiye sahip olabilir ve bu nedenle, tıpkı bir düz çizgi parçasında veya bir karede sayılamayan sonsuz noktalar kümesi olduğu gibi, sayılamayan sayıda durum vardır. . Kuantum mekaniği yasalarına göre, durumlar kümesi sonsuzdur, ancak sayılabilir. Bu nedenle, klasik durum, sürekli sinyallerin iletimi teorisine benzerken, daha kesin kuantum durumu, sayılabilir sayıda ayırt edilebilir sembolden oluşan ayrık sinyallerin iletimi teorisine benzer. Temel olarak ayrık sinyallerin iletim teorisini ele aldık.
Kuantum mekaniğine göre, ideal bir gazın hareket halindeki bir parçacığının enerjisi ancak oldukça kesin değerler alabilir. Bir parçacık bu izin verilen enerjilerden birine sahip olduğunda, belirli bir enerji seviyesini işgal ettiği söylenir . Böyle bir gazın entropisi nedir? Gazın hacmi artarsa, belirli bir enerji aralığındaki enerji seviyelerinin sayısı artacaktır. Bu durumda, sistemin belirli bir r f6MftSpat tipinde olabileceği durumların sayısı artar ve ardından ötropi artar. Böyle bir entropi artışı, kabın bir kısmındaki gazı, diğer kısmındaki boş alandan ayıran bölme kaldırılırsa gerçekleşecek ve gaz hızla genişleyerek tüm kabı kaplayabilecektir.
Gazın sıcaklığı artar ve hacmi değişmezse, parçacıklar daha yüksek enerji seviyelerini işgal edebilir. Bu, parçacıkların işgal edebileceği olası enerji seviyeleri kombinasyonlarının sayısını artıracak ve bu, durum sayısında ve entropide artışa yol açacaktır.
Gazın genleşmesine izin verilirse ve yavaşça pistonu iterse ve gaza ısı uygulanmazsa, o zaman belirli bir enerji aralığındaki enerji seviyelerinin sayısı artacak ve gazın sıcaklığı, sıcaklığı sabit tutacak kadar düşecektir. durum sayısı ve entropi sabiti.
Belirli bir sıcaklıkta, küçük bir hacme kapatılmış bir gazın, aynı sıcaklıkta fakat daha büyük bir hacim kaplayan aynı gazdan daha düşük entropiye sahip olduğunu görüyoruz. Gaz yalnızca bir molekülden oluşuyorsa (bkz. Şekil 10.3), kapı kapalıyken entropisi daha azdır ve molekülün hareketi pistonun bir tarafındaki boşlukla sınırlıdır. En azından molekülün pistonun hangi tarafında bulunduğu biliniyorsa bu böyledir .
Sabit bir sıcaklıkta ideal bir "tek moleküllü gazın" hacminin yarıya inmesinin neden olduğu entropideki azalmayı hesaplamak zor değildir. Hacim yarıya indiğinde durum sayısı da yarı yarıya azalır ve entropi miktara göre değişir.
İle günlük _ 4 0 — — ־ , θ93 k.ve
T ile çarpımına eşittir , yani
0,693*Γ.
(10.11) ifadesine göre , "tek moleküllü bir gazın" hacminin yarıya indirilmesi ve ardından genleşmesine izin verilmesi ve hacmi tekrar aynı oluncaya kadar pistonu itmesiyle elde edilebilecek bu iştir. Böylece, serbest enerjideki değişimi hesapladıktan sonra tekrar (10.11) ifadesine ulaşırız .
"Tek moleküllü" bir ısı motoruyla yapılan deney bu açıdan bakıldığında, bir molekülün pistonun hangi tarafında bulunduğunu belirlemek için bir bitlik bilginin iletilmesi gerektiği ortaya çıkıyor. Bu bilgi, T sıcaklığına karşılık gelen parazit veya gürültü arka planına karşı iletilir. Bunu yapmak için 0,693 kT j enerji harcamanız gerekir .
Artık molekülün pistonun hangi tarafında olduğunu bildiğimiz için entropi, molekülün konumu bilinmiyorsa olduğundan 0,693 k daha az olur. Entropideki bu azalma, serbest enerjide 0,693 kT J artışa karşılık gelir. Ve serbest enerji, pistonun molekülün sık sık çarpma etkisi altında silindirin karşı duvarına doğru yavaşça hareket etmesine izin verilerek işe dönüştürülebilir. Bu durumda, entropi orijinal değerine yükselir ve sistemden bir miktar iş alabiliriz, bu, ne yazık ki, bilmemiz için gerekli olan bu kadar çok bilgiyi aktarmak için gereken minimum enerjiye eşit olur. molekülün pistonun hangi tarafında olduğu.
Şimdi daha karmaşık bir durumu ele alalım. Belirli bir sıcaklıkta bazı fiziksel sistemlerin m duruma sahip olduğunu varsayalım . Bu durumları n eşit gruba ayırıyoruz . Bu grupların her birindeki durum sayısı türe eşit olacaktır.
Sistemin bulunduğu durumun n gruptan hangisine ait olduğunu bulmamızı sağlayan bir mesaj kaynağı olduğunu varsayacağız . 7r eşlenebilir durum grubu olduğundan, entropi (bilgi teorisinde) Iog 7r bittir. Bu , sistemin içinde bulunduğu durumun hangi gruba ait olduğunu belirlemek için Iog 7r ikili hanelerini alacağı anlamına gelir . Bu bilgiyi T sıcaklığında iletmek için en azından ihtiyacı olacak
0,693⅛T Günlük n≈kT Günlük 7g
joule enerji. Başka bir deyişle, bir mesajı iletmek için gereken enerji
, mesajın kaynağının entropisi (bilgi teorisinde) ile orantılıdır .
m durumundan birinde olduğunu bilirsek , o zaman entropi şuna eşittir:
* günlük 77 gr.
Sistemin bulunduğu durumun tam olarak hangi durum grubuna ait olduğunu bilirsek (yani sistemin hangi durum grubunda olduğu hakkında bilgi alınırsa), o zaman entropi şuna eşittir:
İle Günlük -^- \u003d * (10g ve 77ι -Günlük ve 7g).
n durum grubundan hangisinin içinde bulunduğuna ilişkin bilgi aktarımının neden olduğu entropi değişikliği eşittir.
-* günlük 7d ve karşılık gelen serbest enerji artışı
kT'ye eşittir
günlük _ 7y.
Ancak bu değer, sistemin bulunduğu durumun hangi durum grubuna ait olduğu hakkında bilgi iletmek için gerekli olan en küçük enerjiye tam olarak eşittir; bu bilginin aktarımı entropinin azalmasına ve serbest enerjinin artmasına neden olur.
Sistemin hangi durumda olduğunu belirlemenizi sağlayan herhangi bir işlem, bir mesaj kaynağı olarak kabul edilebilir. Bu kaynak, sistemin hangi durumda olduğu konusundaki belirsizliğimizi azaltan bir mesaj oluşturur. Böyle bir kaynaktan gelen bir mesajın iyi tanımlanmış bir entropisi vardır (bilgi teorisinde). Bu entropi, kaynak tarafından üretilen mesajı iletmek için gereken ikili basamak sayısına eşittir. T sıcaklığına karşılık gelen gürültü varlığında bir mesajı iletmek için, ikili basamak başına iyi tanımlanmış bir enerji gereklidir.
Bu mesaj, sistemin hangi durumda olduğu konusundaki belirsizliğimizi azaltır, böylece sistemin entropisini (istatistiksel mekanikte) azaltır. Azalan entropi, sistemin serbest enerjisini artırır. Ancak serbest enerjideki artış, bir mesajı iletmek için gereken minimum enerjiye tam olarak eşittir, bu da serbest enerjide bir artışa yol açar ve bu enerjinin bilgi teorisinde entropi ile orantılı olduğu ortaya çıkar.
Bilgi teorisindeki entropi ile istatistiksel mekanikteki entropi arasındaki bağlantının bu olduğuna inanıyorum. Sistemin entropisinde (istatistiksel mekanikte) azalmaya yol açan bilgiler için ödeme yapmanız gerekir. Bu ücret, bu bilginin geldiği mesaj kaynağının (bilgi teorisinde) entropisi ile orantılıdır. Ve her durumda, ikinci tür bir sürekli hareket makinesinin uygulanmasını engelleyecek niteliktedir.
Bununla birlikte, fiziksel bir sistemin durumu hakkındaki mesajların kaynağının, çok özel ve benzersiz bir mesaj kaynağı türüne ait olduğu belirtilmelidir. Çok daha yaygın kaynaklar, gerçek metin veya sözlü konuşma kaynaklarıdır. Bu tür kaynakların entropisini fizikteki entropi ile ilişkilendirmek için, görünüşe göre, bir bitlik bilginin ideal koşullar altında iletilmesi için gerekli enerjiyi dökmek mantıklıdır.
Fizikteki entropi ile enformasyon teorisindeki entropi arasındaki bağlantı hakkındaki tüm bu yaygara bana bir çay fincanındaki fırtına gibi geliyor. Termodinamiğin ikinci prensibinden kimse şüphe duymuyor. Bununla birlikte, böyle bir çalışma fizikçilere ifadenin kuantum analoğunu (10.4) keşfetmeleri ve incelemeleri için ilham verdiyse, bu mantıklı olacaktır, çünkü böyle bir ilişkinin yokluğu, bilgi teorisinin daha da geliştirilmesini önemli ölçüde etkiler.
Özetleyelim. Bu bölümde, gerçek dünyadaki telekomünikasyon problemlerinden bazılarını ele aldık. Yıldırım ve araba ateşleme sistemleri dahil olmak üzere çeşitli fiziksel fenomenlerin, iletişim kurmak için kullanılan elektrik sinyalleriyle karışan elektriksel parazitler veya gürültü yarattığını gördük. Bu gürültü, sinyal iletiminde bir hata kaynağıdır; belirli bir güçte ve belirli bir bant genişliğinde bir sinyal kullanıldığında bilgi aktarım hızını sınırlar.
Isıtılmış cisimler (ve sıcaklığı mutlak sıfırın üzerinde olan herhangi bir cisim ısınır), beden üzerinde doğal bir ses etkisi yaratan son derece basit, genel ve kaçınılmaz bir ses yayar. Klasik fizik yasalarını kullanarak, bu sınırlamalar matematiksel olarak ifade edilebilir. Ancak ortaya çıkan ifade, yüksek frekanslar ve düşük sıcaklıklar için doğru değildir. Ne yazık ki, bu sınırlamanın genel bir kuantum-mekanik formülasyonuna henüz sahip değiliz.
Hem fizik hem de bilgi teorisinde "entropi" teriminin kullanılması, bu iki entropi arasındaki ilişki sorusunu gündeme getirmektedir. Basit bir örnek kullanarak, termal gürültünün bilgi aktarımına getirdiği sınırlamaların, kaotik ısı enerjisini kaldırılmış bir yükün enerjisine dönüştürmek için bir makine yaratma olasılığını dışladığı gösterilebilir. Böyle bir makine yapılabilseydi, termodinamiğin ikinci ilkesini çürütürdü. Sistemin durumu hakkında bazı bilgi kaynakları, bir mesaj kaynağı olarak kabul edilebilir. Böyle bir kaynağın entropisi (bilgi teorisinde), sistemde zorunlu olarak bulunan termal gürültü varlığında kaynaktan bir mesaj iletmek için gereken enerjinin bir ölçüsüdür. Böyle bir mesajı iletmek için kullanılan enerji, mesajın iletilmesi sonucunda meydana gelen fiziksel entropinin azalması nedeniyle serbest enerjideki artışa eşittir.
Bazı fizikçiler, her biri kendi yöntemiyle, bilgi teorisini istatistiksel mekaniğe uygulamaya çalıştıysa da, bildiğim kadarıyla, faydalı veya şaşırtıcı bir şey bulamadılar. Kuantum etkilerinin bilgi aktarımına dayattığı fiziksel sınırlamalara odaklanmalarını istiyorum. Burada bilgi teorisi için önemli olan diğer çözülmemiş problemlerle karşılaşmaları oldukça olasıdır.
Bölüm Onbir
SİBERNETİK
Bazı kelimeler çok anlamlıdır, korku duygusu uyandırabilir, gizem duygusu, romantizm uyandırabilirler. "Dorothy Lamour'un Malaya peştemâli içinde ne kadar egzotik göründüğünü söylüyoruz . " Bu kelimenin tam anlamı nedir (egzotik), ben kendim tam olarak anlamıyorum, ancak gerçek çevirisinin - yabancı - onun zayıf bir payını bile aktarmadığına ikna oldum. "Palimpsest" kelimesini gördüğümde, Süleyman'ın gizemlerinin kayıp parşömenlerini veya bir cadı iksiri yapmanın sırlarını hayal ediyorum, ancak kelimenin, metnin yer açmak için içinden metnin kazındığı bir el yazmasını dökmek anlamına geldiğini çok iyi biliyorum. yeni girişler..
Başka kelimelerin cazibesi öyle ki, zaman bile onları bayağılığa çeviremez. Sibernetik kelimesinin bu tür kelimelere atıfta bulunduğunu düşünmüyorum , ancak yine de anlaşılması zor romantik bir çağrışım var.
Wiener'in Sibernetik kitabının alt başlığı Hayvan ve Makinede Kontrol ve İletişim'dir. "Sibernetik" kelimesi Yunanca "dümenci" kelimesinden gelir. Bu kelime, 1948'de Wiener'in söz konusu kitabının yayınlanmasından sonra yaygınlaştı, ancak sibernetik olduğu için o zaman birinin bunu uygulaması gerekiyor ve bu kişiye "sibernetik" adı verildi .
Sibernetik nedir? Wiener'in kitabına bakılırsa, sibernetik en azından aşağıdaki bölümleri içerir: artık oldukça aşina olduğumuz bilgi teorisi, belirli bir andaki sinyalin büyüklüğünü ölçmek için kullanılan yumuşatma, filtreleme, tespit ve tahmin teorisi hakkında sorular. ve Wiener'in regülatörler üzerindeki ilk bilimsel çalışmasından itibaren izini sürdüğü negatif geri besleme ve servo mekanizmaları teorisinin yanı sıra, genellikle gürültü varlığında sonraki sinyal değerlerini tahmin etmek için (bir regülatör, bir buhar motorunun hızını tutan bir cihazdır). sabit), 1868'de James K. Maxwell tarafından yayınlandı . Bence bu, otomata teorisi ve bilgisayarların hesaplanmasını ve programlanmasını içeren karmaşık makineler gibi bir alanı da içermelidir.
Ve son olarak, bu liste, sibernetik tarafından incelenen yukarıdaki süreç ve fenomenlerden herhangi birine benzer herhangi bir yaşam sürecini ve fenomeni içermelidir. Bu, insan vücudunun bazı davranış ve düzenleme işlevlerini hemen akla getirir, ancak Wiener daha da ileri gider. İkinci otobiyografik çalışması “Ben bir matematikçiyim”de sosyoloji ve antropolojinin esas olarak bağlantı bilimleri olduğunu ve bu nedenle genel sibernetik kavramına girdiğini ve sosyolojinin dallarından biri olarak ekonomiyi de dahil ettiğini söylüyor.
Wiener'in yaklaşımının ciddiyetinden kimse şüphe duyamaz. Yaşam süreçlerini ve düşünce süreçlerini incelemek için istatistiksel yöntemlerin geliştirilmesi konusunda çok büyük ve önemli bir çalışma yaptı. Maxwell, Boltzmann ve Gibbs'in başlattığı çalışma akışının kendi çalışmalarından geçerek geniş bir felsefi deniz oluşturduğuna inanıyor.
Sorun şu ki, Wiener'in tek bir bilimde - sibernetik - topladığı birçok alandan herhangi biri kendi içinde çok önemli. Her birinin tarihini, içeriğini ve bakış açısını anlatmak için binlerce kelime gerekir. Birlikte ele alındıklarında, artık harika bir ülke değil, inanılmaz büyüklükte ve büyük öneme sahip bambaşka bir Evren oluşturuyorlar. Bu nedenle, çok az uzman sibernetiğin kimliğine bürünme riskini alır.
of Science dizininde isimleri geçenlere ne yaptıklarını sormayı deneyin, sanırım çok azı cevap verecektir - sibernetik. Israr edip tekrar sorarsanız, iletişimle, karmaşık otomatik makinelerle, bilgisayar gibi, deneysel psikolojinin veya nörofizyolojinin bazı bölümleriyle uğraşan biri size şaşkınlıkla bakacak ve konuşmaya başlayacaktır. Sorularınızın arka planı ve niyetleriniz hakkında varsayımlarda bulunun. Önünde, işi hakkında en iyi ihtimalle sadece belirsiz bir fikre sahip olan samimi ve masum bir meslekten olmayan kişi olduğuna karar verirse, o zaman evet cevabını vermesi oldukça olasıdır.
Şimdiye kadar Amerika'da sibernetik kelimesi basında olduğu kadar popüler ve yarı-edebi, hatta yarı-edebi dergilerde acımasızca sömürüldü. Sibernetiğin gösterişli sorunlarını tartışırken onlarla rekabet etmeyi taahhüt etmiyorum. Hepsinden iyisi, tekmeleyin, Wiener bunu “Ben bir matematikçiyim” kitabında kendisi yaptı. Bilim alanlarının tamamen teknik içeriği bile genellikle sibernetik kelimesiyle ilişkilendirilir . o kadar kapsamlı ki, bundan kat kat daha kalın olsa bile, hiçbir şekilde tek bir kitapta anlatmaya cesaret edemem.
kelimesinden bahsedildiğinde aklıma gelen çeşitli teknik sorular hakkında en azından bir fikir vermeye çalışacağım . Ka. Belki de bu kadar kısa bir genel bakış bile okuyucuya yardımcı olacaktır | sibernetikle hiç ilgilenip ilgilenmediğini öğrenmek için | ve ona ne tür bilgiler arayacağını söyle | Bu bilimi daha iyi anlamak için. |
Sibernetiğin | adını verdiğim bölümüyle başlayalım. yumuşatma, filtreleme ve tahmin teorisi, | başlı başına son derece önemli bir alandan. Æ Bu bölüm tamamen matematiksel disiplinlerle ilgilidir | hatları, ancak bazı önemli yönleri olduğunu düşünüyorum | pratik bir örnek dikkate alınarak yeterince açık hale getirilebilir.
Bir uçaksavar silahını bir düşman uçağına nişan almak için radar verilerini kullanma göreviyle karşı karşıya olduğumuzu varsayalım . Radardan, uçağın konumlarının bir dizi ölçümünü alıyoruz ve bu ölçümlerin her biri küçük bir hatayla elde ediliyor. Bu ölçümleri kullanarak ,
Resim. 11.2.
Gelecekte bir noktada konumunu tahmin edebilmemiz ve merminin uçağa çarpmasını sağlamamız için uçağın rotasını ve hızını belirleyin.
Uçağın hızının ve irtifasının sabit olduğunu varsayalım. Daha sonra, uçağın ardışık konumlarına ilişkin radar verileri, Şekil 2'deki çarpı işaretleri ile gösterildiği gibi olabilir. 11.1. A B 9 çizgisini gözle çizebilirsiniz. kolayca görülebileceği gibi, uçağın rotasını oldukça iyi tasvir ediyor. Ama makinenin aynısını yapması nasıl sağlanır?
L noktalarını kullanmaya zorlarsak ve NL 9 yapabileceği tek şey bu iki noktadan düz bir çizgi çekmek. Resimde. 11.1 bu çizgi noktalı bir çizgi ile gösterilir. Açıkçası, bu durumda uçağın rotası yanlış belirlenecektir. Bilgi işlem cihazı bir şekilde önceki verileri hesaba katmalıdır.
Her noktaya aynı değeri veya ağırlığı atayarak bu verileri bir bilgisayarda kullanmak en kolayıdır. Makinenin tam da böyle bir ilke kullandığını varsayalım. Bu durumda, bir araya getirilen tüm verilere karşılık gelen düz bir çizgi çizecektir. Bu, Şekil l'de gösterilen resmi verecektir. 11.2. Bunu T noktasında açıkça görüyoruz. uçak rotasını değiştirdi ve AB 9 düz çizgisi makine tarafından hesaplanan bunu hiçbir şekilde yansıtmaz.
En son verilere öncekilerden daha fazla ağırlık vererek durumu düzeltmeye çalışabilirsiniz. Bunu yapmanın en kolay yolu doğrusal tahmindir .
Resim. 11.3.
niya. Doğrusal tahminde, bilgisayar cihazı her bir radar verisi parçasını (örneğin bir uçağın kuzey veya doğu koordinatına karşılık gelen bir sayı) bir faktörle çarpar. Bu katsayı, ölçümün yaşına bağlıdır. Daha önceki ölçümler için, daha sonraki ölçümlerden daha küçüktür. Hesap makinesi daha sonra ortaya çıkan tüm ürünleri toplar ve gelecekte bir noktada istenen değerin (örneğin, uçağın kuzey veya doğu koordinatları) değerinin ne olacağını tahmin eder.
Böyle bir tahminin sonucu olarak, örneğin Şekil l'de gösterilen elde edilebilir. 11.3. Burada, yeni bir uçak konumunu ve her yeni radar verisi alındığında yeni bir istikameti hesaplamak için doğrusal bir tahmin yöntemi kullanıldı ve şekilde çarpılarla işaretlendi. Bir sonraki ölçüm verileri bilinmediği sürece, tahmin edilen yol, hesaplanan noktadan hesaplanan yönde çizilen düz bir çizgidir. Hesaplama cihazının uçağın G noktasındaki dönüşünü hesaba katmasının uzun sürdüğünü görüyoruz, ancak dönüş, T noktasından sonraki noktanın düştüğü yere bakılarak hemen tanınabilir .
Doğrusal tahmin için daha önceki veriler kullanılabilir, ancak daha sonra bilgi işlem cihazı, daha önceki verilerle çelişen yeni verilere, örneğin uçak döndükten sonraki verilere yavaş yanıt verecektir. Veya tahmini hızlandırmak için esas olarak yeni verileri hesaba katmak mümkündür, ancak bu durumda, daha yeni veriler önceki verilerle çelişmese bile önceki veriler etkili bir şekilde kullanılmayacaktır.
doğrusal olmayan tahmin kullanmak gerekir . Doğrusal tahmin, daha önce belirttiğimiz gibi, her ölçümün, ölçümün reçetesine bağlı olan bir katsayı ile çarpılması ve ardından tüm ürünlerin eklenmesi gerçeğinden oluşur. Doğrusal olmayan tahmin, diğer tüm tahmin yöntemlerini içerir.
Doğrusal olmayan tahminin çok basit bir örneği olarak, biri 100 ölçümü, ikincisi ise yalnızca son 10'u hesaba katan iki farklı doğrusal tahmin ediciyi (kestirici) ele alalım. sonraki ölçüm. Ortaya çıkan ölçüm daha sonra her tahmin edicinin tahmin sonucuyla karşılaştırılır. 100 ölçüme dayalı tahminlerin, yalnızca son 10 ölçüme dayalı tahminlere göre radar verileriyle arka arkaya üç kez daha iyi eşleştiğinde kullanıldığını varsayalım. Uçak, önceki verileri kullanışsız hale getirecek şekilde manevra yaparsa, son 10 ölçüme dayalı tahminler kullanılır. Böyle bir tahmin yöntemi doğrusal değildir, çünkü buradaki tahmin, her ölçümü yalnızca ölçümün süresine bağlı olan bir katsayı ile çarparak değil, farklı bir şekilde gerçekleştirilir. Önceki verilerin kullanımı (veya kullanılmaması), alınan verilerin doğasına göre belirlenir.
Genel olarak konuşursak, doğrusal olmayan tahminler yapmanın sonsuz sayıda yolu vardır. Aslında, en basit doğrusal olmayan tahmin sınıfını ve diğer doğrusal süreçleri hariç tutsak bile, doğrusal olmayan tahminleri içeren çok sayıda çok çeşitli doğrusal olmayan süreç olacaktır. Doğrusal tahmin hakkında oldukça fazla şey biliniyor, ancak doğrusal olmayan tahmin hakkında neredeyse hiçbir şey bilinmiyor.
Bir uçağın konumunu tahmin etmeye ilişkin çok özel örneğimiz, yalnızca soyut olarak formüle edildiğinde neredeyse anlamsız görünebilecek ifadeleri göstermek için kullanılmıştır. Şimdi daha geniş ve daha genel bir sorun ortaya koyalım.
Bir dizi olası sinyal hayal edin. Bu sinyallerin herhangi bir şeyi göstermesine izin verin - uçağın olası rotası veya bir kişinin söyleyebileceği çeşitli kelimeler. Biraz daha gürültü veya biraz bozulma olsun. Radar verileri yanlış olabilir veya görüşmenin yapıldığı oda çok gürültülü olabilir. Doğru sinyalin bazı özelliklerini hesaplamak gerekir: uçağın o anda veya gelecekteki bir noktada konumu veya muhataplardan birinin az önce söylediği kelime veya bundan sonra söyleyeceği kelime. . Ayrıca, bu yargıyı yaparken, uçağın hangi rotaları alması muhtemel olduğu veya ne sıklıkta dönüş yaptığı veya bu dönüşlerin ne kadar dik olduğu gibi sinyalin istatistiksel modellerini bildiğimizi de varsayalım. Ya da en yaygın sözcükleri ve bunların ortaya çıkma olasılığının önceki sözcüklere nasıl bağlı olduğunu biliyoruz. Gürültü ve distorsiyonun istatistiksel kalıplarını da öğrenelim.
Burada, bu problemde dikkate alınan sinyallerin, bilgi teorisinde ele alınan sinyallerle aynı forma sahip olduğunu görüyoruz. Bununla birlikte, bir sinyal kaynağını ve gürültülü bir kanalı incelerken, bilgi teorisyeni, belirli bir kaynaktan gelen mesajları belirli bir iletişim kanalı üzerinden iletilmek üzere kodlamanın en iyi yolunun ne olduğunu sorar. Öte yandan tahmin teorisinde, üzerlerine gürültü bindirilmiş bir dizi sinyali incelerken, bu sinyali tespit etmenin en iyi yolunun ne olduğunu ve büyüklüğü gibi bazı özelliklerinin nasıl hesaplanacağını veya tahmin edileceğini soruyoruz. gelecekte bir noktada sinyal?
Tahmin teorisi cephaneliği, Kolmogorov ve Wiener tarafından geliştirilen genel lineer tahmin teorisini ve bir dizi özel lineer olmayan tahmin edicinin matematiksel analizini içerir. Bu ifadeden daha ileri gitmeye pek değmez, ancak matematikçi David Sdepiats tarafından yürütülen teorik araştırmanın şaşırtıcı sonuçlarından birini alıntılamanın cazibesine karşı koyamıyorum:
Aşağıdaki durumu göz önünde bulundurun: zayıf bir sinyal içerebilecek veya içermeyebilecek güçlü bir gürültü var. Bir sinyalin var olup olmadığını belirlemek istiyoruz. Somutluk açısından, sinyal ve gürültünün voltajı veya ses basıncını temsil ettiği düşünülebilir. Gürültü ve sinyal kombinasyonunun toplamı olarak temsil edilebileceğini varsayalım. Ayrıca, gürültü ve sinyalin ergodik olduğunu (bkz. Bölüm 3) ve bant sınırlı olduklarını, yani belirli bir frekans aralığının dışındaki frekansları içermediklerini varsayalım . Ayrıca, gürültünün frekans spektrumunu tam olarak bildiğimizi, yani frekans aralığının çok küçük her bir bölümünde ne kadar güç olduğunu bildiğimizi varsayalım. Sinyalin frekans spektrumunun gürültünün frekans spektrumundan farklı olmasına izin verin. Slepyan, bir sinyalin toplam voltajını (veya ses basıncını), herhangi bir zaman aralığında her an üzerine bindirilmiş gürültü ile doğru bir şekilde ölçmek mümkün olsaydı, bu aralık ne kadar kısa olursa olsun, o zaman doğru olarak mümkün olacağını gösterdi. Sinyal ne kadar zayıf olursa olsun, sinyal olup olmadığını söyleyin. Bu teorik sonuç, pratik olarak yararsız olmasına rağmen tamamen doğrudur. Ancak, bir sinyal yeterince zayıfsa (ve hatta ne kadar zayıf olduğunu doğru bir şekilde tespit ederse), bu sinyalin üzerine gürültü bindirilmiş herhangi bir sonlu zaman aralığında incelenerek tespit edilemeyeceğini iddia edenlere korkunç bir darbe indirdi.
tahmin ve tespitten değil, aynı zamanda filtreleme ve yumuşatma hakkında da konuştuğumu açıklamak isterim . Sinyale karışan gürültü, sinyalin frekans spektrumundan farklı bir frekans spektrumuna sahipse, gürültüye hakim olan frekansları kesen ve frekansları geçiren bir elektrik filtresi kullanılarak sinyali gürültüden ayırmak mümkündür. sinyale hakim olun. Yüksek frekansların çoğunu veya tamamını ortadan kaldıran bir filtre alırsanız, çıkış sinyali giriş kadar keskin bir şekilde değişmeyecektir; çıkış sinyalinin gürültü ile birleşimi yumuşatılacaktır .
Buraya kadar, sinyalin o andaki değerini ayarlayabilmek ve gelecekteki sinyalin değerini tahmin edebilmek için alınan verilerin nasıl dönüştürüldüğünden bahsettik. Bu, elbette, belirli bir amaç için yapılır.
Örneğin, bir düşman uçağının peşine bir önleyici gönderilsin. Radar, uçağı gözden uzak tutmak için kullanılır. Uçağın konumunun her ölçümünden sonra, önleyiciyi düşmana yönlendirecek şekilde kontrol yüzeylerinin konumunu düzeltmek mümkün olacaktır.
Belirli bir amaca ulaşmak için alınan bilgilere ve onun değişikliklerine göre sürekli hareket eden bir cihaza servo mekanizma denir. Bu yeni bir şey çünkü radar verileri artık yalnızca bir uçağın diğerine göre konumunu ölçmekle kalmıyor, aynı zamanda önleyicinin konumunun nasıl değiştirileceğini de belirliyor. Radar verileri geri beslenir ve daha sonra elde edilecek olan radar verilerinin doğasını değiştirir (çünkü veriler uçağın konumunu ölçmek için kullanılır ve uçağın konumu da yeni radar verilerini etkiler). Bu geri bildirime negatif geri bildirim denir çünkü belirli bir programdan herhangi bir sapmayı artırmak yerine azaltmak için uygulanır.
Olumsuz geri bildirimin başka örneklerini düşünmek zor değil. Örneğin, bir buhar motoru regülatörü, motorun devrini ölçer ve ardından bu değeri, devri belirli bir seviyede tutmak için bir valfi açmak veya kapatmak için kullanır. Böylece devir sayısını ölçme sonucu geri beslemeye dahil edilir ve devir sayısını değiştirir. Duvardaki termostat odadaki sıcaklığı ölçer ve sıcaklığı sabit tutmak için ısıtıcıyı açar veya kapatır. Bir su teknesi taşıdığımızda, suyun davranışını izler ve suyun dökülmemesi için tekneyi dengeleriz. Ve çoğu zaman bu soruna yol açar. Suyun dökülmemesi için tekneyi ne kadar çok eğersek, su o kadar çok sıçramaya başlar. Geri bildirim oluşturmak için süreçle ilgili önceki bilgileri değil, şu anda aldığımız bilgileri kullandığımızda, tüm süreç kararsız hale gelebilir. Diğer bir deyişle, uyguladığımız kontrol, verilen programdan küçük sapmaları azaltmak yerine, onları artırabilir.
Kararsızlık, geri besleme devrelerinde çok tehlikeli bir olgudur. Düzeltmenin daha eksiksiz ve mükemmel olması için geri bildirimi daha güçlü hale getirmek gerekir. Ancak bu tam olarak sistemin kararsız olacağı gerçeğine yol açabilecek şeydir. Doğal olarak, kararsız bir sistemde iyi olan hiçbir şey yoktur. Hedefi takip etmek yerine uçağın veya merminin rotasını rastgele değiştirmesine neden olabilir, odadaki sıcaklık aniden yükselir ve keskin bir şekilde düşer, motor hızlanır ve sonra durur ve amplifikatör düşük olur. girişinde sinyal olmadığında yüksek sesle ıslık çalın.
Negatif geri beslemeli sistemlerin kararlılığı çok iyi incelenmiştir ve belirli bir zamanda belirli bir değerin önceki değerlerin toplamının yalnızca bağlı olan sayılarla çarpıldığı negatif geri beslemeli doğrusal sistemler hakkında çok şey bilinmektedir. ölçümün reçetesi üzerine.
Negatif geri beslemeli doğrusal sistemlerin kararlılığı veya kararsızlığı, giriş sinyalinin uygulanıp uygulanmadığına bağlı değildir. Doğrusal olmayan geri besleme sistemleri, giriş sinyallerinin bazı değerleri için kararlı, diğerleri için kararsız olabilir. Doğrusal olmayan bir sistemin bir örneği, "kükreyen" bir arabadır. Düz bir yolda belirli bir hızda sabit olabilir, ancak herhangi bir tümsek, tümsek çok geride kaldıktan sonra süresiz olarak devam edebilecek bir "yalpalamaya" neden olabilir.
İşin garibi, ancak çalışması olumsuz geri bildirimli sistemler üzerindeki ilk teorik çalışmaların çoğuna ayrılmış olan cihazdan hiç bahsetmedik. Bu cihaz, 1927'de Harold Black tarafından icat edilen bir negatif geri besleme amplifikatörüdür .
Bir amplifikatörün kazancı, çıkış voltajının giriş voltajına oranıdır. Telefon ve diğer elektronik alanlarında, neredeyse sabit kazançlı amplifikatörlere sahip olmak çok önemlidir. Ancak vakum tüpleri ve transistörler uyumlu cihazlar değildir.
başardı. Kazançları zamanla değişir ve giriş sinyalinin büyüklüğüne bağlıdır. Negatif geri besleme, vakum tüplerinin ve transistörlerin kazancındaki bu tür değişikliklerin etkisini azaltır.
ŞEK. 11.4, bunun neden böyle olduğunu anlamak zor değil. Yukarıdaki, kazancı 10 olan geleneksel bir amplifikatördür. Soldaki sayı ile gösterildiği gibi girişinde 1 volt beslenirse , sağdaki sayı ile gösterildiği gibi, çıkış 10 volttur. Bu amplifikatörün kazancının 5'e yarıya düştüğünü varsayalım. Bu , yukarıdaki bir sonraki şekilde gösterilmiştir. Çıkış voltajı da yarıya düşecek ve 5 V'a eşit olacak, yani kazanç azaldıkça aynı miktarda azalacaktır.
Üçüncü şekil, kazancı 10 olan bir negatif geri besleme amplifikatörünü göstermektedir . Bu şekildeki en üstteki cihaz, 100'lük yüksek bir kazanca sahiptir . Bu cihazın çıkışı, vakum tüpü veya transistör içermeyen çok hassas bir voltaj bölücü ile birleştirilmiştir. kazancı zamana veya sinyal seviyesine bağlı değildir. Üst cihazın girişindeki sinyal giriş voltajına eşittir, yani 1 V eksi çıkış voltajının 0,09 kısmı olan ve 0,9 V'a eşit olan alt cihazın çıkış sinyali.
100 değil, 50 olacak şekilde değiştiğini varsayalım (bkz. Şekil 11.4'ün alttaki şekli ). Bu şekildeki voltajlar yaklaşıktır, ancak yine de üstteki cihazın kazancı yarıya inerse çıkış voltajının sadece %10 düştüğünü görebilirsiniz . Üst cihazdan daha yüksek bir kazanç alırsak, parametreleri değiştirmenin etkisi daha da az olacaktır.
Olumsuz geri bildirimin değeri fazla tahmin edilemez. Negatif geri besleme amplifikatörleri telefonda vazgeçilmezdir. Odanızdaki termostat, negatif geri bildirim kullanmanın başka bir örneğidir. Negatif geri bildirim, kimyasal işleme tesislerinde süreçleri kontrol etmek ve uçaklara ateşlenen mermileri kontrol etmek için kullanılır. Uçak otopilotu, uçağı rotasında tutmak için negatif geri bildirim kullanır.
Biraz daha geniş anlamda, bir kalemi kağıt üzerinde hareket ettirdiğimde gözlerimden elime olumsuz geri bildirim kullandığım ve konuşmayı veya başkalarının sesini taklit etmeyi öğrendiğimde kulaklarımdan gelen geri bildirimi kullandığım söylenebilir. Benim dudaklarım. Canlı bir organizmada, diğer birçok durumda negatif geri bildirim de kendini gösterir, dış ortamın sıcaklığındaki değişikliklere rağmen vücut sıcaklığını sabit tutan ve kanın ve dokuların kimyasal özelliklerini sabit tutan bu geri bildirimdir. İnsan vücudunun, çevredeki değişikliklere rağmen vücudun iç durumunu neredeyse hiç değişmeden sürdürme yeteneğine homeostaz denir.
Sibernetikçi olduğunu itiraf etmekten çekinmeyen birkaç cesur adamdan biri olan Ashby, kendisine göre organizmanın çevreye uyum sağlama yeteneğinin en karakteristik özelliklerini göstermek için homeostat adı verilen bir makine yarattı. Homeostat, birçok geri besleme devresinin yanı sıra bunları ölçmek için iki cihazla donatılmıştır. Bunlardan biri homeostatın kendisi tarafından kontrol edilir, diğeri ise “çevre” makinesi üzerindeki etkiyi taklit eden kişi tarafından kontrol edilir. "Ortamı" değiştirerek devrelerin parametrelerini makineyi kararsız bir duruma sokacak şekilde seçersek, o zaman makinenin kendisi deneme yanılma yoluyla devrelerin parametrelerini değiştirir ve durumu tekrar kararlı hale gelir.
İsterseniz, bir homeostatın davranışını, yürümeyi, bisiklete binmeyi veya hayatta uyum sağlamanız gereken diğer birçok şeyi öğrendiğinde bir çocuğun davranışıyla karşılaştırabilirsiniz. Sibernetik adlı kitabında Wiener, sinir sisteminin önemli unsurlarından biri olarak geri bildirime özel önem veriyor ve bir kişinin sıradan herhangi bir şeyi yapamamasını tam olarak olumsuz geri bildirimin olmamasıyla açıklıyor; örneğin titreyen eller, vücuttaki negatif geri besleme döngülerinden birinin hasar görmesinin sonucudur.
Bu nedenle, sibernetiğin üç bileşenini ele aldık: bilgi teorisi, yumuşatma ve filtreleme dahil algılama ve tahmin teorileri ve negatif geri beslemeli servomekanizmalar ve yükselticiler dahil negatif geri besleme teorisi. Bunlara ek olarak, elektronik bilgisayarlar ve bunlara benzer diğer karmaşık cihazlar genellikle sibernetik alanına atıfta bulunur. Bu tür cihazlara bazen otomat denir .
Modern karmaşık makinelerin -bilgisayarlar, otomatlar ve diğer mekanizmalar- önceki yüzyıllarda pek çok öncülü vardır. Ve belki de onları incelemeye değer çünkü bu, modern karmaşık cihazları daha iyi anlamamıza yardımcı olacaktır. İnsanlar yaratarak ve yaratılanlar üzerinde düşünerek öğrenirler. Yeni karmaşık makineler yaratma olanakları, önceki yüzyıllara kıyasla ölçülemeyecek kadar arttı ve daha fazla düşünce çalışması için bu teşvikleri fark etmemek zor.
Geçen yüzyılın sonunda otomatik telefon santralinin icadından bu yana karmaşık makinelerin gelişimini takip edelim. İlk otomatik telefon santralleri oldukça ilkeldi; adım araştırıcılar ana unsurlarıydı , τjj yani bir sonraki rakam çevrildikten hemen sonra hattın yeni bir bölümü bağlandı. Daha sonra, telefon santralleri iyileştirildi ve dinlemeli sistemlere dönüştürüldü . Bu değiş tokuşlarda, çevrilen rakam anahtarı hemen çalıştırmaz. İlk olarak, otomatik telefon santralinin ünitelerinden birinde elektriksel veya mekanik bir değer şeklinde depolanır. Diğer bloktaki elektrikli cihaz daha sonra, boş bir devre bulana kadar aboneleri birbirine bağlamak için kullanılabilecek çeşitli elektrik devrelerini araştırır. Aboneler bu zResim boyunca birbirine bağlıdır.
Modern telefon santralleri, alışılmadık derecede karmaşık ve büyük boyutludur. Birlikte, ülkenin geniş telefon ağını oluştururlar. Uygun numarayı çevirerek, ülkenin her yeri ile görüşebilirsiniz. Bu, şüphesiz insan elinin yarattığı en karmaşık yapıdır. Çok fazla kelime alacaktı. en azından genel anlamda telefon santrallerinin nasıl çalıştığını açıklamak. Şimdi, telefon kadranını birkaç kez çevirmek, telefon cihazlarının, doğrudan bağlantı yoksa, çok uzakta bir yerde bulunan istenen aboneye en ekonomik şekilde şehir şehir atlayarak arama yapmasına neden olacaktır. Telefon cihazı bağlantı kuracak, aboneyi arayacak, zamanı not edecek, görüşme ücretini kaydedecek ve aboneler telefonu kapattığında devreyi açacaktır. Blok arızalarını merkez istasyona bildirecek ve bu arızalara rağmen çalışmalarına devam edecektir.
Telefon santrallerinin önemli bileşenlerinden biri elektrik rölesidir . Röle, bir elektromıknatıs ve hareketli kontakların sabitlendiği bir armatür ile hareketli kontakların devreyi kapatabileceği sabit kontaklardan oluşur. Rölenin elektromıknatısının bobininden bir elektrik akımı geçtiğinde, armatür elektromıknatısa çekilir. Bu durumda, bir grup hareketli kontak, karşılık gelen sabit kontaklardan uzaklaşarak devreyi açar ve diğer hareketli kontak grubu, karşılık gelen sabit kontaklarla temas ederek devreyi kapatır.
1930'larda Bell Telephone Laboratories'den Stibitz, karmaşık sayıları toplayabilen, çıkarabilen, çarpabilen ve bölebilen karmaşık bir bilgi işlem cihazı oluşturmak için röleleri ve telefon teknolojisinin diğer bileşenlerini kullandı. 2. Dünya Savaşı sırasında, Bell Telephone askeri amaçlar için bir dizi gelişmiş aktarma bilgisayarı yaptı ve 1941'de Howard Aiken ve Harvard Üniversitesi'ndeki ortakları ilk aktarma bilgisayarlarını yarattılar.
Bilgisayarların hızını artırmada önemli bir adım, Eckert ve Mohly tarafından Eniac savaşından kısa bir süre sonra yaratıldı - vakum tüpleri üzerinde bir bilgisayar ve son zamanlarda bu amaçlar için tüpler yerine transistörler kullanıldı.
Böylece, karmaşık bilgisayarlar alanında ilerlemeyi sağlayan ana faktörlerden biri, bu makinelerin önce röleler, ardından vakum tüpleri ve transistörler üzerine inşa edilmesi olasılığıydı.
Bu tür karmaşık cihazlar yaratırken, elbette, sadece parçaların kendilerine değil, aynı zamanda bunların bağlantı şemalarına da sahip olmak gerekiyordu, böylece cihaz, çarpma ve bölme gibi belirli eylemleri gerçekleştirebilirdi. Bu bağlamda, Boole cebrinin (matematiksel mantığın dallarından biri) röle devrelerinin inşası ve hesaplanması için Tibitz ve Shannon'ın kullanımının son derece önemli olduğu ortaya çıktı.
Böylece, uygun parçaların mevcudiyeti ve belirli işlemleri gerçekleştirmek için bunları bağlama sanatı, deyim yerindeyse, karmaşık bir makinenin "gövdesini" oluşturuyordu. Ancak, makinenin kontrolü, "ruhu" daha az önemli değildir, ancak vücudun kendisi olmasaydı pek gelişemezdi.
Karmaşık sayılarla ilgili işlemler için Stibitz makinesinin neredeyse hiç "ruhu" yoktu. Operatör, bir teletip makinesi kullanarak karmaşık sayı çiftlerini makineye girdi ve biraz düşündükten sonra toplamı, farkı, çarpımı veya bölümü bildirdi. Bununla birlikte, 1943'te Stibitz, uzun delikli bir kağıt bant veya 258'den fazla reçete yazan bir program kullanılarak tüm talimatların sırayla girildiği bir aktarma bilgisayarı yarattı.
kayymy Chyblamy ve hangi sırayla işlemleri gerçekleştirmeniz gerekiyor .
Bir sonraki etiket, tamamlanmış bir görevin bir kısmını tamamladıktan sonra bir makinenin programın önceki bir bölümüne geri dönmesini veya hesaplamalara yardımcı olması için yardımcı bantların kullanılmasını mümkün kılıyordu. Bu durumda bilgisayar belli bir noktaya geldiğine karar vermeli ve ardından bu karara göre hareket etmelidir. Örneğin, makinenin aşağıdaki serilerin toplamını terim terim ekleyerek hesapladığını varsayalım:
1 L_j_ J — LJ- J — L
1 3 ' 5 7^9 li ψ,, ∙
1/ 1.000.000'den küçük bir terim bulunana kadar terim toplamaya devam edecek şekilde programlayabilir ve ardından sonucu yazdırmasını ve başka bir hesaplama yapmasını sağlayabiliriz. Bu durumda örneğin bilgisayar 1/ 1.000.000'den hesaplanan son terimi çıkararak bir sonraki adımda ne yapılacağına karar verebilir, cevap hayır ise makine bir sonraki terimi hesaplamalı ve diğerlerine eklemelidir; cevap evet ise alınan miktarı yazdırmalı ve daha fazla talimat için programa başvurmalıdır.
Bilgisayar tarihindeki bir sonraki büyük adım, genellikle atom bombalarının geliştirilmesiyle ilgili hesaplamaları yapmak için ilk bilgisayarları kapsamlı bir şekilde kullanan John von Neumann'ın adıyla ilişkilendirilir. İlk makinelerin bile bir hafızası, yani ara hesaplamalarda kullanılan sayıların daha sonraki işlemler için saklandığı ve cevapların basılmadan önce toplandığı bir depolama cihazı vardı. Von Neumann'ın fikri, talimatı veya programı ayrı bir kağıt kasete değil, doğrudan makinenin belleğine girmekti . Bu, talimatların girişini basitleştirdi ve makineyi daha esnek hale getirerek programın herhangi bir bölümünü hesaplamaların sonuçlarına göre değiştirmeyi mümkün kıldı.
Masaüstü toplama makinelerinde, ondalık basamaklar, on farklı konumdan herhangi birini döndürebilen ve işgal edebilen tekerlekler kullanılarak depolanır. Modern karmaşık bilgisayarlar, ikili sayıları depolar. Bir ikili sayının her basamağı, küçük bir manyetik halkanın veya çekirdeğin bir yönde veya diğer yönde mıknatıslanmasıyla görüntülenir. Bir bilgisayarın belleği, bu tür çekirdeklerden oluşan gruplardan oluşur ve her grup, çok basamaklı bir sayının tüm basamaklarını depolayabilir ve tüm bu basamaklar, saniyenin birkaç milyonda biri içinde grubun çekirdeklerinden aynı anda yazılır ve okunur. Her çekirdek grubuna , adres adı verilen belirli bir ikili sayı atanır ; Bu numaralar vasıtasıyla gruplar belirlenir ve kullanıma çağrılır. Adrese genellikle yalnızca ikili sayılar değil, aynı zamanda çekirdek grupları da denir. Devasa modern bilgisayarlar, manyetik çekirdeklerde yüzlerce ve binlerce ikili sayı depolayabilir ve hatta daha fazlasını manyetik bantlarda veya manyetik tamburlarda darbeler + veya - şeklinde depolayabilir . .
Bilgisayarların belleğe ek olarak, toplayabileceği veya çarpabileceği aritmetik birim gibi başka özel birimleri de vardır. İki numara üzerinde herhangi bir işlem yapmanız gerekirse, bunlar önce adreslerden kayıt adı verilen geçici bir depolama konumuna gönderilir. Ardından işlem yürütülür ve sonuç uygun bellek adresine yönlendirilir.
Programcı, yüzlerce veya daha fazla farklı talimat şeklinde bir program yazar . Programcı, bir dizi bu tür komut kullanarak, ne yapılması gerektiğini kendisi için açıkça hayal ederse, makineye kelimenin tam anlamıyla her şeyi yaptırabilir. Başka bir deyişle, hedefe ulaşmak için gerekli tüm adımları gösterebilmelidir. Ayrıca sorun, makinenin sorunu kabul edilebilir bir süre içinde çözebileceği şekilde olmalıdır.
Masada. Şekil 15, varsayımsal bir bilgisayarda birkaç sayıyı toplamak ve elde edilen toplamları hatırlamak için kullanılan bir takım komutları göstermektedir. Matematik dilinde konuşan bu program, Ct = a i + b i , Nerede
lδ tablosu
1 = 1 - 3. a sayısı ben 9 + i adresinde , ⅞ sayısı 12 + i adresinde ve c i sayısı adres 15 + L' de depolanır Program yürütme adres 1'de başlar ve adres 9'da biter.
Yetenekli bir programcının, kendisinin ne yapılması gerektiğini açıkça anlaması koşuluyla, bir makineye her şeyi yaptırabileceğini zaten söylemiştik. Bazı standart kelimeler veya denklemler biçiminde bir matematik probleminin kesin bir formülasyonu olduğunu varsayalım. Bu ifadenin yapılması gereken her şeyi tam olarak anlattığını varsayalım. Programcı derleyici program denilen şeyi yazabilir ve bu programa göre makine verilen formülasyonu kendisi inceler ve ardından sorunu çözmek için bir program yazar. Bilgisayar tarafından bir hyrogram-compiler yardımıyla derlenen program makineye yerleştirildikten sonra makine çözme işlemine geçer.
Programlama sıkıcı ve nankör bir iştir. Bir mühendis veya bilim adamı doğru derleyici programa sahipse, kendisine göre ne yapılması gerektiğini belirtmek için bir dizi "sözcük" ve yoğunlaştırılmış bir biçimde denklemler kullanabilir. Bir derleyici program aracılığıyla, bilgisayarı, problemin formülasyonunu uzun, ayrıntılı ve (insanlar için) anlaşılmaz bir komutlar dizisinin diline çevirmeye zorlayabilir ve ardından bilgisayar tüm hesaplamaları yapacaktır.
Fortran derleyici programı, matematiksel sembollere çok benzer sembollerle yazılmış talimatları bir bilgisayar programına dönüştürmek için kullanılan yaygın olarak bilinir. Blodi'nin derleyici programı, elektrikli bir cihazın devre şemasını, makinenin bu devrenin çalışmasını simüle etmesini sağlayan bir programa dönüştürür. Janet'in derleyici programı, bir müzik parçasının her notanın perdesini, süresini ve tınısını gösteren notasyon işaretlerini, makinenin verilen seslerin daha sonra çalınabilecek manyetik bir kaydını oluşturmasına neden olan bir programa dönüştürür.
Derleyici programlar, çok çeşitli karmaşık problemlerin çözümünde çok faydalıdır. Bir bilgisayarın belleğinde saklanan ikili basamaklar yalnızca sayıları görüntülemek için değil, aynı zamanda sözcükleri, müzik sembollerini ve mantıksal işlemleri görüntülemek için de kullanılabilir. Böylece bilgisayarlar, karmaşık matematiksel hesaplamalara ek olarak alfabetik dizinler oluşturabilir, otomatik bir telefon santralinin işleyişini taklit edebilir, 0'dan 9'a kadar konuşulan sayıları tanıyabilir, tashki oynayabilir ve bu oyunu öğrenebilir, satranç oynayabilir, geometri teoremlerini ve sembolik mantığı kanıtlayabilir, oluşturabilir . olağandışı müzikal ses kombinasyonları ve kontrpuan kurallarına göre müzik besteler.
Tüm bunların nasıl yapılabileceğini anlamak için en azından biraz deneyelim. Harflere belirli ikili rakamlar atanabilir, böylece alfabetik sıraya göre düzenlenmiş kelimeler artan sayılara karşılık gelir. Bu, kelimeleri alfabetik sırayla düzenlemek için kelimeleri temsil eden sayıları kullanmanıza izin verecektir. Notalara, sayı farkı bu notalar arasındaki müzik aralığına karşılık gelecek şekilde numaralar atanabilir, böylece belirli müzik aralıklarının izin verilmesi veya yasaklanması, belirli farklılıkların izin verilmesi veya yasaklanmasıyla eşdeğerdir.
Ancak kendimizi kandırmayalım - bilgisayar kullanmanın karmaşık yöntemlerini birkaç kelimeyle açıklamak o kadar kolay değil. Yetenekli. özel bir matematik eğitimi olan bir kişi, birkaç yıllık çalışma ve pratik çalışmadan sonra programlamayı kabul edilebilir bir şekilde anlamaya başlar. Yalnızca gerçekten yetenekli bir kişi bir makineye gerçekten yeni ve zor bir şey yaptırabilir.
Prensipte bir bilgisayar her şeyi yapacak şekilde programlanabilse de, elbette kişinin bunun nasıl yapılacağına dair yeterince iyi bir fikre sahip olması koşuluyla, programcılar makinenin önüne koymak istedikleri bazı görevleri tam olarak anlamazlar. . Bu nedenle, bir bilgisayar yine de sesle konuşulan sayıları bir kişi kadar iyi tanıyamaz, bir dilden diğerine tatmin edici bir şekilde çeviri yapamaz, dama veya satranç da ve bir uzmanla aynı hızda oynayamaz. , ne kadar önemli veya önemli olduğunu belirleyemez. şu ya da bu teorem ilginçtir ve ilginç müzik besteleyemez.
Ancak bu tür görevler için bilgisayar kullanma isteği, insanları kelime tanımanın doğası, çeşitli dillerin yapısı, çeşitli oyunlarda dövüşme stratejisi ve müziğin yapısı hakkında düşündürür. Bu tür araştırmalar sonucunda elde edilen yeni bilgiler, geleceğin daha büyük ve daha hızlı bilgisayarlarını programlamak için kullanıldığında, elbette yeni zorluklar ortaya çıkacaktır, ancak bunların hangileri olduğunu şimdiden kestirmek pek mümkün değildir.
Tüm söylenenlere ek olarak, bilgisayarların karmaşık ve olağandışı sorunları çözmek için programlanmasının bize yeni, oldukça nesnel bir anlama kriteri verdiğini de eklemek gerekir. Bugün biri size bir kişinin belirli bir durumda nasıl davrandığını anladığını veya bir matematik probleminin nasıl çözüleceğini anladığını söylerse, onu bir bilgisayarı insan davranışını taklit edecek şekilde programlayarak anladığını göstermeye davet edin. veya belirli bir sorunu çözer. Bunu yapmazsa, anlayışı en azından kusurludur ve bunun bir hayalden başka bir şey olmaması mümkündür.
Makineler düşünebilir mi? Düşünmenin ne anlama geldiğini tanımlayana kadar bu anlamsız bir sorudur . Oldukça özgün bir tarza sahip bir matematikçi olan Marvin Minsky, bununla ilgili bir mesel anlattı. Birisi satrançta herkesi yener. İnsanlar, "Ne yetenek, ne akıl, ne harika bir hafıza, ne harika bir düşünür!" Ona soruyorlar!: “Herkese karşı kazanmayı nasıl başarıyorsun?” Cevap verir: "Bir takım kurallar biliyorum ve onları uygulamaya çalışıyorum." Hemen herkes kızmaya başlar: “Evet, bu hiç de düşünmüyor. Evet, mekanik iş.
Minsky'nin çıkaracağı ders, insanların yalnızca kendilerinin anlamadıklarını düşünce olarak görme eğiliminde olmalarıdır. Daha da ileri gideceğim ve insanların genellikle dilbilgisi açısından doğru olan "anlamlı" kelimelerin hemen hemen tüm karmaşasını bir düşünce olarak düşündüklerini söyleyeceğim. Bazen bana öyle geliyor ki "düşünmek" bir sorunu çözmemizi sağlayan şeydir ve bu nedenle mekanik olsun ya da olmasın faydalıdır. Ne olursa olsun, filozoflar, diğer beşeri bilimlerin temsilcileriyle birlikte, muhtemelen sonsuza kadar düşünmeyi öyle bir tanıma sığdırmaya çalışacaklar ki bu, insanı her zaman makinenin bir adım üstüne koyuyor. Bu onların mutluluğuysa - sağlıkları için, hiç umurumda değil. Ama yine de, İngilizce tarafından önerilen "taklit oyunu" (imitasyon g, ame) dahil, bir kişinin gücü dahilinde olan ancak bir makine tarafından çözülemeyen anlamlı ve iyi tanımlanmış bir sorunu işaret etmenin imkansız göründüğünü düşünüyorum. 1936'da mantıkçı Turing .
Bu oyun, bir kişinin bir bilgisayara veya başka bir kişiye bir teletip yardımıyla bağlanması gerçeğinden oluşur. Ve kiminle olduğunu bilmiyor. Soru soran bir kişi, kiminle bağlantılı olduğunu bulmaya çalışır. Bilgisayar onu burnundan yakalamak için programlandı. Tabii ki, modern bilgisayarlar ve modern programlama teknikleri, bilgisayardan ve makinenin bu oyunu gerçek başarı şansı ile oynamasını sağlayacak programdan hala çok ama çok uzak.
Sibernetiğin gerçekten de çok geniş bir bilim olduğunu gördük. Bu kitabın konusu olan bilgi teorisinin yanı sıra radar ve diğer askeri uygulamalar için çok önemli olan karmaşık düzeltme ve tahmin teorilerini içerir. Tamamen doğru olmayan radar verilerine dayanarak bir uçağın şimdi veya gelecekte bir noktada konumunu doğru bir şekilde hesaplamaya çalıştığımızda, Wiener'e göre sibernetik ile uğraşıyoruz. Bir frekanstaki gürültüyü başka bir frekanstaki sinyalden bir elektrik filtresiyle ayırırken bile sibernetiğe yönelmek zorunda kalıyoruz.
Wiener en büyük katkısını bu genel alanda yaptı; doğrusal cihazları kullanarak genel bir tahmin teorisi geliştirdi; burada tahmin, her ölçümü, ölçümün reçetesine bağlı bir faktörle basitçe çarparak ve elde edilen ürünleri toplayarak gerçekleştirilir.
Sibernetiğin bir başka kısmı da olumsuz geri bildirimdir. Termostat, oda sıcaklığını algıladığında negatif geri besleme kullanır ve sıcaklığı belirli bir seviyede tutmak için ısıtıcıyı açar veya kapatır. Bir uçağın otopilotunda, kontrol kollarını harekete geçirmek ve böylece istenen uçuş irtifasını ve yönünü korumak için negatif geri besleme kullanılır. İnsanlar ellerinin hareketini kontrol etmek için olumsuz geribildirim kullanırlar.
Negatif geri beslemeli cihazlar kararsız olabilir; çıkış sinyalinin etkisi bazen çalışma modunun istenenden büyük ölçüde sapmasına neden olur. Wiener, örneğin, el titremesini ve insan vücudunun normal işleyişindeki diğer bazı bozuklukları, geri bildirim mekanizmasının yanlış işleyişiyle açıklar.
Negatif geri besleme, amplifikatörün çıkışında küçük giriş sinyalinden şekil olarak çok farklı olmayan büyük bir sinyal üretmek için de kullanılabilir. Negatif geri besleme yükselteçleri, sibernetiğin ortaya çıkmasından çok önce iletişim sistemleri için son derece önemliydi.
Ve son olarak, sibernetik, uzun yıllardır var olan telefon santralleri ve ancak İkinci Dünya Savaşı'ndan sonra ortaya çıkan bilgisayarlar da dahil olmak üzere, tüm otomatlar ve karmaşık makineler alanında hak iddia ediyor.
Ve eğer öyleyse, o zaman sibernetik modern teknolojinin özüdür. İnsan vücudu ve faaliyetleri hakkındaki bilgimizi içerir. Sibernetik, neredeyse tüm en heyecan verici ve heyecan verici sorunları tanımlamak için kullanılan bir kelime haline geldi. Bildiğimiz gibi, Wiener sibernetiğe sosyolojik, felsefi ve etik sorunları da dahil etti.
Yani, birisi onun bir sibernetik olduğunu kabul ederse, o zaman bu, onun dahi bir general olması dışında, faaliyet alanını pek iyi karakterize etmez. Ve elbette bu, bilgi teorisini mutlaka iyi bildiği anlamına gelmez.
Neyse ki, daha önce de söylediğim gibi, yalnızca birkaç bilim adamı kendilerini sibernetik olarak tanıyor ve o zaman bile umutsuzca geri kaldıklarını düşündükleri kişilerle sohbet ediyor. Sibernetik çok geniş bir kavram olmasına ve belki de tamamen açık olmamasına rağmen, bu genişlik ve belirsizlik bize zarar vermeyecektir. Gerçekten de sibernetik kelimesi çok kullanışlıdır. Bir insanı, bir nesneyi ve hatta bir kitabı romantizm halesi ile çevreleyebilir. Umarım bu kelime kitabımıza biraz romantizm katar.
On İkinci Bölüm
BİLGİ TEORİSİ
VE
PSİKOLOJİ
Bilgi teorisi ve psikoloji üzerine okuyabileceğimden ve hatta hatırlamak isteyebileceğimden çok daha fazlasını okudum. Çoğu durumda, bunlar basitçe yeni terimleri eski ve belirsiz fikirlerle ilişkilendirme girişimleriydi. Açıkçası, bu çalışmaların yazarları, sanki sihirle sanki yeni terimlerle hokkabazlık yapmanın belirsiz ve daha önce yanlış anlaşılan her şeyi açıklığa kavuşturacağını umuyorlardı.
oldukça iyi düşünülmüş olduğu söylenmelidir . Bir dizi önemli verinin elde edildiği deneylere yol açtılar. Doğru, bu deneylerden kesin sonuçlar çıkarmak zordur, ancak bunlar ilginç hipotezler için bir temel veya en azından bir bahane görevi gördü. Bu bölümde, anlamaya değer olacak kadar mantıklı olan bu deneylerden bazılarını ele almayı öneriyorum. Onları elbette kendi zevkime göre seçtim, ama sonuçta, böylesine geniş ve belirsiz olmaktan da öte bir konu hakkında anlaşılır bir şeyler ifade etmek için açıklamayı bir şekilde sınırlamak gerekiyor.
Bana öyle geliyor ki, psikologların bilgi teorisine ilk tepkisi, entropi bilgi miktarının harika ve evrensel bir ölçüsü olduğundan ve bir kişi bilgiyi bir kez kullandığında, herhangi bir görevin zorluğunun, diyelim ki gereken süre olduğu sonucuna vardı. çözmek için, bir anlamda alınan bilgi miktarıyla orantılı olmalıdır.
Bu anlayış, deneysel psikolojinin bir temsilcisi olan Ray Hyman'ın bir makalesinde çok canlı bir şekilde resmedilmiştir. Makale 1953'te Journal of Experimental Psychology'de yayınlandı . Yaptığı deneylerden sadece birini anlatacağım.
Konunun önüne birkaç ampul yerleştirilir (psikologların deneysel insan dediği gibi). Her ampul, konunun önceden tanıtıldığı tek heceli bir "ad" ile adlandırılır. Uyarı sinyalinden sonra ışıklardan biri yanıp söner ve öznenin "adını" mümkün olduğu kadar çabuk söylemesi gerekir. Bu, salgın anından deneğin tepkisine kadar geçen süreyi ölçer.
Deneylerden birinde, sekiz lambadan biri yanıyor ve her lambanın yanması rastgele ve eşit derecede olası. Bu durumda, deneğin yanıp sönen ampulü doğru bir şekilde adlandırmasını sağlayan bilgi miktarı 10g 2 8 veya 3 bittir. Diğer deneylerde yedi ışıktan biri (2.81 bit), altı ışıktan biri (2.58 bit), beş ışıktan biri (2.32 bit), dört ışıktan biri (2 bit), üç ışıktan biri (1 ,58 bit), iki ışıktan biri (1 bit) ve genellikle bir (0 bit). Ortalama reaksiyon süresi veya gecikme, yani bir ampulün yanıp sönmesi ile adının söylenmesi arasındaki süre, grafiğin bir ekseni boyunca, bit cinsinden bilgi ise diğer ekseni boyunca çizilmiştir (Şekil 12.1 ).
800
Resim. 12.1.
Deneyin sadece bir ampulle yapılması durumunda bile, burada esasen bir seçim olmamasına ve bilginin sıfır olmasına rağmen, bir miktar gecikmenin gözlemleneceği açıktır. Deneyde birden fazla ampul kullanılırsa gecikme süresindeki artış bilgi miktarı ile doğru orantılıdır. Seçim sayısındaki artışla birlikte gecikmede böyle bir artış, Alman psikolog Merkel tarafından 1885 gibi erken bir tarihte not edildi. Bu şaşırtıcı derecede kolayca yeniden üretilebilen oran, elbette insan tepkisinin önemli bir özelliğidir.
Şekil l'de gösterilen grafikten 12.1'de, eklenen her bit için gecikme süresinin 0,15 saniye arttığını görebilirsiniz . Bazı psikologlar buradan, bu 0,15 saniyenin bir kişinin 1 bitlik bilgiye yanıt vermesi için gerekli olduğu ve bu nedenle insan çıktısının yaklaşık 1/0,15 veya saniyede yaklaşık 7 bit olduğu sonucuna varmak için acele ettiler. İnsan algısının ve belki de insan düşüncesinin evrensel Koistite'sini keşfetmedik mi?
Hyman'ın deneyinde, zamandaki artış gecikir. , bit cinsinden ölçülen olayların belirsizliği ile orantılıdır. Ancak, diğer araştırmacılar tarafından yapılan deneylerde, bilgi biti başına gecikme süresinin biraz farklı olduğu ortaya çıktı. Ayrıca G. Mobray ve M. Rhodes tarafından 1959'da yayınlanan veriler, uzun süreli eğitimler sonucunda bilgi miktarındaki artışın zaman üzerinde çok az veya hiç etkisi olmadan elde edilebileceğini göstermektedir. Görünüşe göre, farklı insanlar bilgiyi farklı şekilde işleyebilir; Bu nedenle, öğrenme sürecinde olası seçeneklerin sayısı çok önemlidir, ancak uzun bir eğitimden sonra bu seçenek sayısı, yeterince büyük bir değere kadar, önemsiz bir rol oynar. Ama öyle bir deney var ki deneğin parmakları klavyenin üzerine uzanıyor ve parmakların titreşimine tepki olarak bir veya daha fazla tuşa basması isteniyor. Bu durumda, bilgi miktarının artmasıyla ve eğitim olmadan gecikme süresindeki artışın küçük olabileceği ortaya çıktı.
Ayrıca, gecikme süresi sabit bir değer artı bilgi miktarındaki artışla orantılı bir zaman artışına eşit olsa bile, yine de bit cinsinden bilgi miktarındaki artışı bu zaman artışına bölerek, bilgi aktarım hızını elde ederiz. Şimdi anlatacağım örnekte, bu şekilde inanılmaz bilgi aktarım hızlarına ulaşmanın mümkün olduğunu göreceğiz.
G. Kboctler, deneklerden bazı enstrümanlarda rastgele bir dizi notayı (veya akorları) tekrarlamalarının veya tamamen rastgele seçilmiş kelimelerin dizilerini olabildiğince hızlı bir şekilde okumalarının istendiği bilgi aktarım hızını belirlemek için deneyler yapan ilk kişilerden biriydi. olabildiğince. J. Licklider, verilen nesnelerin okuma hızını ve tanınma hızını belirlemek için deneyler yaptı. Ancak bu çalışmayı duymadan önce, J. Karlin ve ben kelime listelerini okuma üzerine geniş bir dizi deneye başladık. daktiloda Mors kodu bilgisi veya yazma hızı.
16 kelimelik bir "alfabe" olarak göndermeyi seçtiğini varsayalım . Daha sonra bu alfabeden rasgele ve eşit olasılıkla sözcükleri seçerek bir liste yapar. Bu durumda, her kelimeyi seçme ölçüsü, Iog 16 veya 4 bittir. Konu, bilgiyi basılı karakterlere değil yeni bir forma, yani konuşmaya dönüştürerek "aktarır". Bunu yapmak için derlenmiş listeyi yüksek sesle okur. Saniyede 4 kelime okuyabiliyorsa , o zaman 4x4 veya saniyede 16 bit hızında bilgi iletiyor demektir .
Resimde. 12.2, üç denekle yapılan deneylerde elde edilen verileri gösterir. Deney için en sık kullanılan 500 İngilizce kelime seçildi . İki kelimelik bir sözlükten dört kelimelik bir sözlüğe geçerken (yani kelime başına 1'den 2 bit'e giderken ) bilgi oranı belirgin bir şekilde düşerken , kelime içeren sözlüklerde (“alfabeler”) neredeyse hiç değişmediği görülmektedir . 4 ila 256 kelime ( kelime başına 2 ila 8 bit).
Ve şimdi, örneğin Hyman'ın bu amaçla kullandığı verileri, yani gecikme süresindeki artışla ilgili verileri kullanarak bilgi aktarım hızının değerini elde etmenin mümkün olduğu iddiasını hatırlayalım. olay başına bit sayısı. Üç deneğimizin özelliklerinin ortalamasını alalım ve elde edilen verilere göre Şekil 1'i çizelim. 12.2 noktalı çizgi. Word başına 2 bitten 8 bit'e geçerken okuma hızındaki düşüş tamamen farkedilmez yani word başına bit sayısı 6 artmış olmasına rağmen kelime başına okuma hızı farkı sıfırdır. Şimdi 6'ya bölersek 0'a kadar , sonsuz yüksek bir bilgi aktarım hızı elde ederiz! Elbette bu saçma, ancak bilgi aktarım hızını Hyman'ın yaptığı gibi bit sayısındaki artışı gecikme süresindeki artışa bölen deneylerin verilerinden türetmek daha az saçma değil mi?
ŞEK. 12.2 denek 4 "sekiz bitlik" kelimeleri 3.8 kelime hızında okuduğunda doğrudan görülebilir.
Resim. 12.2.
8 × 3,8 veya saniyede yaklaşık 30 bit hızında bilgi iletmeyi başarır . Liste, 5000 kelimelik bir sözlükten (kelime başına 12,3 bit) rastgele seçilen kelimeleri aldığında, bunları saniyede 2,7 kelime hızında okumayı başarır , bu da daha da yüksek bir bilgi aktarım hızına ( saniyede 33 bit) yol açar.
Bir kişinin yeteneklerini ve davranışını tanımlarken özel bir bilgi aktarım hızı kullanamayacağı açıktır. Bazı koşullarda bir kişi, diğer koşullardan daha iyi bilgi iletebilir (ve daha sonra göreceğimiz gibi soruları yanıtlayabilir ve hatırlayabilir). Bir kişiyi, bir kişiye özgü özellikleri ve sınırlamaları olan bilgileri işlemek için bir kanal veya cihaz olarak düşünmek en uygunudur. İnsan çok esnek bir cihazdır, çeşitli şekillerde sunulan bilgileri çok iyi işleyebilir, ancak uygun şekilde kodlanırsa ve yeteneklerine uygun şekilde uyarlanırsa onu daha iyi ve daha hızlı işler.
Ve olasılıkları nelerdir? ŞEK. 12.2, görevin artan karmaşıklığıyla, bir kişinin çalışma hızını oldukça az azalttığı görülebilir. Alfabeden seçilen 256 kelimelik listeleri neredeyse 4 kelimelik bir liste kadar hızlı okuyabilir . Bir kişi hız açısından bir makineye fark edilir şekilde kaybeder ve onun verimli çalışmasını sağlamak için onun için zor görevler belirlemeniz gerekir. Ve bu sadece beklenebilir.
Bununla birlikte, Şekil 2'deki çizim noktasından görüldüğü gibi. 12.2, 5000 kelimeden oluşan alfabeye karşılık gelen yeni karmaşıklık, sonunda hala insan yeteneklerini azaltıyor. Kelime başına çok sayıda bit veren ve iletim hızını önemli ölçüde azaltmak için yeterli kelimeye sahip olmayan bazı optimal alfabe veya sözlük var gibi görünüyor. Kısmen böyle bir sözlük arayışındaydık, Carlin ve ben okuma hızını bir kelimedeki hece sayısına ve kelimeye "yakınlık derecesine", yani kelimenin ilk bin heceden seçilip seçilmediğine bağlı olarak ölçtük. , ilk on kelimeden veya ilk on dokuz bin kelimeden, dilde geçiş sıklıklarına göre sıralanmıştır. Yaptığımız ölçümlerin sonuçları Şekil 1'de gösterilmektedir. 12.3.
Bir kelimedeki hece sayısındaki artışın, hece sayısındaki azalma kadar okuma hızını belirgin şekilde yavaşlattığını görüyoruz.
Okuma hızı, saniyede kelime
Bir kelimedeki hece sayısı
Şekil, 12 3,
aşinalık derecesi Sonuç olarak, tanıdık tek heceli kelimelerden oluşan bir sözlük belki de en iyisi olabilir. En bilinen 2500 tek heceli kelimeden oluşan bir sözlüğü (sözlüğün bu hacmi kelime başına 11,3 bit verir) "tercih edilen" bir sözlük olarak kullanarak, liste saniyede 3,7 kelime hızında okunabilir , bu da bir bilgi aktarım hızına karşılık gelir saniyede 42 bit.
"Sahte metin", yani teknik olmayan bir metnin olasılık özelliklerine göre seçilmiş ve gramer dikkate alınmaksızın rastgele düzenlenmiş kelimelerden oluşan bir metin, okurken yüksek hızda bilgi aktarımı elde etmeyi de mümkün kılar. Bu durumda entropi, saniyede 3,7 kelimelik maksimum okuma hızıyla kelime başına yaklaşık 11,8 bittir, bu da saniyede 44 bitlik bir bilgi aktarım hızına karşılık gelir.
Muhtemelen, bu göstergeler alfabeyi geliştirerek arttırılabilir, ama bence çok değil. Her halükarda, herhangi bir yerde gerçekleştirilen tüm deneyler arasında en yüksek bilgi aktarım oranını bunlar verdi. Doğru, elektrik iletişimi yoluyla bilgi aktarım hızına kıyasla yüksek değil, ancak çok sayıda ikili seçenekle ilişkili - dakikada 2500 !
O zaman hız sınırı nedir? Belki de kelimeleri hecelemek zorunda olduğun için? Ancak bu durumda, Çinliler muhtemelen en iyi konumda olacaktır, burada her kelime bir işaretle gösterilir, ancak hem Çince hem de İngilizce'yi kolayca okuyan Çinliler, rastgele karakter listelerini neredeyse eşit hızda ve rastgele listeleri okur. eşdeğer İngilizce kelimeler.
Ya da belki sınırlamalar doğası gereği mekaniktir? Resimde. Şekil 12.4, çeşitli görevlerin verildiği deneylerin sonuçlarını göstermektedir.Böylece, bir kişi, "tercih edilen" bir sözlükten seçilen rastgele kelime listelerini okuma hızının iki katından daha fazla bir hızda öğrenilmiş cümleleri tekrarlayabilir; anlamlı bir metni okurken gözle görülür bir hız artışı meydana gelir. Bundan, okuma hızının sınırlandırılmasının, görünüşe göre, okuma mekanizmasıyla değil, insan ruhunun özellikleriyle açıklandığı açıktır.
Dolayısıyla, bir kişinin yeteneklerini belirli bir bilgi aktarım hızıyla karakterize edemeyiz. Bir görevin zorluğu sonunda bilgi miktarıyla birlikte artsa da, bu görevin kişinin yetenekleriyle ne kadar tutarlı olduğuna önemli ölçüde bağlıdır. Bir kişinin uyarlanabilirliği çok yüksektir, ancak kendisini zorlaması ve sonuç olarak hızını düşürmesi, onun için alışılmadık bazı işler yapması gerekir. Bir kişi, çok hızlı olmasa da, karmaşık görevlerle çok iyi başa çıkar.
Görevi insan yeteneğiyle eşleştirmenin bir yöntemi, dikkatli ve iyi tasarlanmış deneyler yapmaktır. Bu yöntem, gürültülü bir kanal üzerinden maksimum bilgi aktarım hızını elde etmenizi sağlayacak şekilde mesajları kodlama sürecine benzer. Bu konu Bölüm 8'de ele alındı ve orada ulaşılabilecek en yüksek bit hızına kanalın bant genişliği adı verildi. "Tercih edilen sözlük", tam da rastgele seçilen kelimelerin listelerini okurken yüksek bir bilgi aktarımı hızı elde etmek amacıyla en sık kullanılan 2500 tek heceli kelimeden derlendi .
Bununla birlikte, İngilizce metinde bulunma olasılıklarına eşit bir olasılıkla sözcükleri rastgele seçerek, aynı veya daha yüksek bilgi aktarım hızına ulaşıldığını unutmayın. İngiliz dilinin sözcükleri ve kullanım sıklıkları, uzun bir bilinçsiz deney ve evrim süreciyle bir şekilde insanın kapasitesine uyarlanmış olabilir.
5. Bölüm'de bir kelimenin bir metinde geçme olasılığının sıralamasıyla yaklaşık olarak ters orantılı olduğunu gördük. Başka bir deyişle, en çok kullanılan 100. kelime, en çok kullanılan kelimeden neredeyse yüz kat daha az karşımıza çıkıyor. Resimde. Şekil 5.2 (s. 106) , onu en az çaba ilkesine bağlayan J. Zif tarafından ilk kez işaret edilen ilişkiyi göstermektedir .
Açıkçası, Zif yasası bu kadar basitleştirilmiş bir biçimde kesinlikle doğru olamaz. 5. Bölüm'de, bir dildeki tüm sözcüklerin bulunma olasılıklarının sıralamalarıyla ters orantılı olamayacağı gösterildi. Durum böyle olsaydı, o zaman tüm kelimelerin olasılıklarının toplamı birden büyük olurdu. Zif yasasını değiştirmek, türetmek ve açıklamak için defalarca girişimde bulunuldu; onlar hakkında daha sonra konuşacağız. Başlangıç olarak, yasasını orijinal ve en basit haliyle ele alalım, yani onu insan dilsel davranışının yönlerinden birinin yaklaşık bir açıklaması olarak, Zif'in gerçek istatistikleri inceleyerek ampirik olarak formüle ettiği bir açıklama olarak düşünelim. metinler.
Söylediğimiz gibi, Zif yasasını en az çaba ilkesine bağladı. Bir metni oluşturmak için harcanan çabayı veya "harcamayı" o metindeki harf sayısıyla eşitleme girişimiydi. Bununla birlikte, çoğu dilbilimci önce konuşulan dili dikkate alır ve becerilerin olması pek olası değildir.
konuşma, okuma ve yazma esas olarak kelimelerdeki harf sayısına göre belirlenirdi.
Nitekim, bilgi aktarım hızını belirlemek için yapılan deneylerde, okuma hızının hem günlük Çince karakterler hem de harflerle yazılmış eşdeğer İngilizce kelimeler için aynı olduğunu gördük. Ek olarak, ŞEK. 12.3 kelimelerin kullanım sıklığının veya onlara aşinalık derecesinin okuma hızı üzerinde bir kelimedeki hece sayısı kadar büyük bir etkisi olduğunu gördük.
Örneğin, okuma hızını bir çaba ölçüsü olarak almak mümkün müdür? Ne de olsa, sıradan avların bizim için daha erişilebilir olduğu, onları olağandışı olanlardan daha az çabayla, daha az zamanla tanıdığımız varsayılabilir. Belki de insan beyni, içinde az sayıda kelime depolanabilecek ve onları kolayca tanıyabilecek şekilde tasarlanmıştır, ancak çok daha büyük bir kısmı, onları kullanmanın daha zor olacağı şekilde depolanmıştır. O zaman, bir kelimeyi okumak için harcanan zamanın, onun erişilebilirliğinin, kullanım kolaylığının, bir miktar "harcama" ölçüsünün bir ölçüsü olduğu düşünülebilir.
Bir kişinin dili kullanarak, belirli bir süre içinde mümkün olduğunca fazla bilgi aktaracak şekilde kelimeleri seçtiği hayal edilebilir. Bu maliyetler bir kelimeyi telaffuz etmek için gereken zamanla tanımlanırsa, o zaman bir kişinin kelimeleri belirli bir süre içinde mümkün olduğu kadar çok bilgi iletecek şekilde seçtiği söylenebilir.
yardımıyla , i'inci kelimenin (kullanım sırasına göre) t r zamanında telaffuz edildiğini göstermek kolaydır , daha sonra rastgele seçilen kelimelerden oluşan bir mesaj için, i'inci kelimenin p (r) şuna eşit bir olasılıkla seçilmesi koşuluyla bilgi aktarım hızı maksimum olacaktır.
(12.1)
p(r) = 2- c 4
burada c, olası tüm kelimelerin olasılıklarının toplamı bire eşit olacak şekilde seçilen bir normalleştirme sabitidir. Bu matematiksel ifade, yüksek sesle okunması daha uzun süren kelimelerin, kısa ve telaffuzu kolay kelimelere göre daha az yaygın olması gerektiğini göstermektedir. Maksimum bilgi aktarım hızı isteniyorsa, İlişki (12.1) tam olarak yerine getirilmelidir .
Zif yasasının doğru olduğunu varsayarsak, o zaman i'inci kelimenin ortaya çıkma olasılığı şuna eşit olmalıdır:
P (G) \u003d 4' ( 12 • 2 >
burada A başka bir sabittir. (12.1) ve (12.2)' den şunu elde ederiz:
y-=2 - c'r. (12.3)
Ekte verilen bağıntılar kullanılarak ifade (12.3) aşağıdaki gibi yazılabilir:
Zr = a4δlogr, ( 12.4)
burada a ve b, t r zamanının bağımlılıkları incelenerek belirlenecek sabitlerdir. Zif yasası geçerliyse ve bu yasanın verdiği olasılıklarla rastgele ve bağımsız olarak seçilen sözcükler için bilgi aktarım hızı maksimize ediliyorsa, bağıntı (12.4) deneysel olarak doğrulanmalıdır .
(12.1) karşılık gelen olasılıklarla seçilen kelimelerin birim zamanda maksimum bilgi sağlayacağı tartışılamaz . Yine de, rastgelelik ve kelime seçiminin bağımsızlığına dayalı tahminlerin gerçek İngilizcede mevcut olanlara ne kadar yakın olduğunu bilmek ilginç olacaktır.
Dilbilimle çok ilgilenen bir matematikçi olan Benoit Mandelbrot, bu konuyu deneysel psikolog D. Howes tarafından elde edilen kelimeleri okuma zamanına ilişkin verilerin analizi ile bağlantılı olarak değerlendirdi. Psikoloji alanında çok deneyimli bir deneyci olan R. Reese ve itaatkar hizmetkarınız da (12.4) ifadesiyle deneyin uyuştuğunu doğrulamaya çalıştılar.
Böyle bir karşılaştırma yapmanın bazı zorlukları vardır. Yüksek sesle okuma hızının, kelimeleri telaffuz etme zamanı ile değil , tanıma zamanı ile sınırlı olduğu oldukça açıktır. Uzun tanıdık bir kelimeyi telaffuz eden bir kişi, aynı anda kısa bir kelime algılayabilir, ancak
Resim. 12.5<
yabancı kelime Bu zorluğun üstesinden gelmek için, görünüşe göre, art arda üç kelimeyi telaffuz etmek için gereken toplam süreyi ölçerek ve ardından bu süreyi tek tek kelimeler için formül (12.4) tarafından bulunan sürelerin toplamıyla karşılaştırarak bir miktar ortalama alma yapılmalıdır .
Reese tüm bunları ustaca ve muhteşem bir şekilde yaptı ve Şekil 1'de gösterilen verileri elde etti. 12.5. Deney I'de denek maksimum hızda bir pasaj okudu. Şekil 1'deki düz çizgi ן . Formül (12.4)' e göre yürütülen 12.5 , I ile çakışıyor !
Ch kadar iyi verir
Ondan sadece talep edebilirsiniz. Bununla birlikte, (12.4) ilişkisinin gerçekten sağlandığını kanıtlamak için deneysel noktalar bir külçe içinde dağılmıştır . ζ
Dahası, böyle bir dağılım beklenebilirdi, çünkü r sıralaması, belirli bir kelimenin farklı kaynaklardan elde edilen metinde geçme sıklığına karşılık gelir ve bunu, konunun deneyim ve aşinalık derecesinin bir göstergesi olarak kullandık. bu kelime. Ayrıca, ∣ olarak Şek. 12.3, okuma sırasında bunu bekleyebilirsiniz ||
niya'nın borcun süresi üzerinde de bir etkisi olacak | Son olarak, ardışık kelimeler arasındaki bağlantıyı ihmal ettik.
Bu son derece sıkıcı bir deney. Bu türden başka deneyler tasarlanabilir, ancak hepsi çok zaman gerektirir ve bunlardan genel olarak geçerli ve net bir şey elde etme şansı çok azdır. Belki bir gün bir dahi her şeyi çabucak çözebilir, ancak temkinli bir psikolog muhtemelen çalışmalarının kesin, net sonuçlar vaat ettiği alanı kendisi için seçecektir.
Ancak yapılan çalışma, en azından kelimelerin kullanımının çaba tasarrufuyla belirlenebileceğini ve çaba ekonomisinin de zaman ekonomisi olarak ölçülebileceğini gösteriyor . Bununla birlikte, bunun İngiliz diliyle baş etme yeteneğinin gelişmesinin bir sonucu mu yoksa dilin bir şekilde insan ruhunun yeteneklerine uyarlanmış olması ilginçtir. Mesela kullandığımız kelime sayısında durum nasıl?
kullandığı farklı kelimelerin toplam sayısıyla ve bir kişinin kelime dağarcığını bildiği kelime sayısıyla ölçeriz. Bununla birlikte, nadir ve olağandışı kelimeler, konuşulan ve edebi dilin yalnızca küçük bir bölümünü oluşturur. Peki ya dilin çoğunu oluşturan kelimeler? Kaç tane?
Bu sayının medeniyet derecesine bağlı olması beklenebilir. Bununla birlikte, aynı kavramları belirtmek için her zaman farklı sözcükleri veya sıradan sözcüklerin kombinasyonlarını kullanma seçeneğine sahibiz. Yani “sarışın”, “esmer”, “kızıl saçlı” veya “sarı saçlı kız”, “siyah saçlı kız”, “ateşli saçlı kız” diyebilirim. Bu durumda açık, koyu, ateşli ve saçlı kelimeleri başka amaçlar için kullanılabilirken, sarışın, esmer, kızıl saçlı kelimeleri sadece saç renginin tonlarını belirtmek için kullanılır.
Böylece, söylediğimiz her şey, İngilizce'den daha fazla veya daha az sıradan kelimeler içerebilen bir tür yapay dil oluşturarak ifade edilebilir. Aslında, isterseniz, İngiliz alfabesinin 26 harfini, İngilizce'deki herhangi bir ifadenin çevrilebileceği özel bir dilin belirli bir sözlüğü olarak
düşünebilirsiniz .
Resim. 12.6.
tüm dillerin belirli bir miktarda kelime kullanma eğiliminde olması ve bu miktarın çevrenin görünürdeki karmaşıklığı tarafından değil, insan beyninin yetenekleri ve tasarımı tarafından belirlenmesi oldukça muhtemeldir . Bu temel kelime dağarcığına, akıllı ve uyarlanabilir insanlar, istedikleri veya hatırlayabildikleri kadar çok özel ve daha az yaygın kelime ekleyebilirler.
Zif, yasasını gösteren grafiklerin yardımıyla bu soruyu inceledi. Resimde. 12.6 * , James Joyce'un "Ulysses" kitabından (eğri L) 260.430 kelimenin sıralamasına (kullanım derecesine) bağlı olarak sıklığını (yani, belirli bir kelimenin kaç kez kullanıldığını) ve
♦ J. Zief'in Nitap Behavior and the Principle of Least JSffort, Reading, Mass n 1949'dan uyarlanmıştır.
Bir gazete metninden 43.989 kelime ( B eğrisi). Çizgi C, idealleştirilmiş Zif eğrisini, yani "yasayı" gösterir.
Açıktır ki, AnB eğrilerinin konumu sadece verilen örnekteki kelime sayısına göre belirlenir; çok önemli olan kelime sayısı değiştikçe eğrilerin eğiminin sabit olmasıdır. Sağ alt köşedeki eğrilerdeki kırılmalar, nadir, az kullanılan kelimelerin bir, iki, üç kez vb. Olabilmesinden, ancak 1,5 veya 2,67 kez geçememesinden kaynaklanmaktadır .
Bu eğriler, 45°'lik bir açıyla çizilen bir düz çizgi C ile idealleştirilirse , bu durumda sadece eğimlerinin doğru yansıtılmadığı görülebilir. Frekans ölçümlerimize frekans ekseninin başına denk gelen ve sadece bir kez geçen kelimelerle başlıyoruz. Benzer şekilde, sıralama ekseni birinciden, yani en yaygın kelimenin sıralamasından başlar. Böylece, dikey ve yatay eksenler 1 rakamıyla başlar (Şekil 12.6'daki grafiğin sol alt köşesi ) ve eksenlerdeki eşit dilimler, aynı sayıda değişimi gösterir. Zieph yasasını temsil eden C düz çizgisinin şunu söylediğini görüyoruz: Örnekteki farklı sözcüklerin sayısı, en yaygın sözcüğün geçiş sayısına eşit olmalıdır.
Daha da ileri gidilebilir ve şöyle söylenebilir: Zif yasası bu kadar açık ve basit bir biçimde doğruysa, o zaman örnekteki tüm kelimelerin yarısı, sayıları sayının kareköküne eşit olan en yaygın kelimeler olacaktır. Bu örnekte geçen farklı kelimeler . Resimde. Şekil 12.7, farklı kelimelerin sayısı olan N'nin ve toplamın yarısını oluşturan kelimelerin sayısı olan V'nin örnekteki toplam kelime sayısı olan L' ye nasıl bağlı olduğunu gösterir .
Kurtulamayacağınız kelime dağarcığı sınırlamaları var. Böylece, Joyce'un söz konusu eserinin yarısı 170 kelime uzunluğundadır, ancak Şekil 2'den de görülebileceği gibi; 12.6, aynı şey gazete için de geçerli!
Zif, içinde bir kelime gibi görünen şeyleri bir kelime olarak düşünürsek, bu yasanın Gotik dil için geçerli olduğunu gösteren eğriler verir. Grafiğin sol üst köşesinde bazı sapmalar görülse de, bu yasa Yidiş (Yeni İbranice), Eski Germen ve Orta Üst Germen için de oldukça geçerlidir. Norveç dili için eğriler sağ altta sol üsttekinden daha diktir ve Hint kabilesinin dili
oooo
Resim. 12.7.
Hudson Körfezi'nin güneyinde yaşayan Cree , Zif yasasına göre çizilen bir çizginin eğiminin 3/4'ü kadar eğimli bir eğri verir. Bu, belirli bir uzunluktaki bir metinde daha fazla sayıda farklı kelime, yani daha geniş bir kelime dağarcığı anlamına gelir. Çince, sol tarafta yukarı doğru fırlayan ve daha küçük bir kelime dağarcığını gösteren bir eğri oluşturur.
Tüm dillerde bulunan benzerlik oldukça dikkat çekicidir. Bu, edebi dillerin hepsinde olmasa da çoğunda kelimelerin olasılıksal dağılımının pek çok ortak noktası olduğu gerçeğiyle açıklanmaktadır. Belki de diller, beynin yapısı olan insan ruhunun yetenekleri tarafından dikte edilen bazı genel şemalara kaçınılmaz olarak uyum sağlar. Tüm insanların çevrelerindeki aynı sayıda nesneyi fark etmeleri ve sonuç olarak aynı şey hakkında konuşmaları mümkündür. Donuk ve sert bir kuzey ülkesindeki bir Eskimo, gerekli sayıda kelimeyi bulmayı başarır ve birçok kar halinin her birini özel bir kelimeyle belirtir. Çölde yaşayan bir Arap, develeri ve onların donanımlarını tarif etmek için pek çok kelime kullanır. İnsanlar arasında bilgi alışverişinde bulunma çabasını en aza indirgemek için tüm dillerin bir şekilde adapte edilmiş olması da mümkündür. Ama tabi gerçekte işlerin nasıl olduğunu bilmiyoruz.
Zif'in çalışmaları eleştirel bir şekilde incelendi. Bir örnekteki farklı kelimelerin sayısının yalnızca örneğin uzunluğuyla belirlendiğine ve yazara bağlı olmadığına inanamıyorum. Ve elbette, Zif yasasının en basit şekliyle ifade edilmesine rağmen, pasajın uzunluğu değiştiğinde artikelin geçiş sıklığı değişemez . Genel olarak Zif yasasının yaklaşık 120.000 kelimelik örnekler için geçerli olduğu söylenir ; daha küçük pasajlar için çok fazla kelime yalnızca bir kez görünür ve büyük pasajlar için çok az kelime bir kez görünür. Sadece büyük bir gazeteci grubunun birlikte gazetede Joyce ile aynı kelime dağarcığını oluşturabileceğini varsaymak daha mantıklı görünüyor.
Şimdiye kadar, Zief yasasına deneysel verilerin bir tür yaklaşık açıklaması olarak yaklaştık ve bunun neye yol açacağını merak ettik. Zif yasasına başka bir şekilde yaklaşılabilir. Metnin "nesli" ile ilgili basit varsayımlara dayanarak yasanın adil olduğunu göstermeye çalışalım. Birçoğu, Zieph yasasının belirli varsayımlardan çıktığını göstermeye çalışsa da, yalnızca matematikçi Benoit Mandelbrot (daha önce bahsettiğimiz) ileriye doğru ilk önemli adımı atmayı ve bu yönde en ileriye gitmeyi başardı.
Mandelbrot iki çıkarım yöntemine işaret etti. İlkinde, metnin, Bölüm 3'teki İngilizce metne birinci dereceden yaklaşıma benzer şekilde, rastgele ama farklı olasılıklarla seçilen bir harfler ve kelimeler arasındaki boşluklar dizisi olarak yaratıldığını öne sürdü. boşluklarla ayrılmış harf dizilerinden oluşan farklı "kelimeler" sayısı .
Mandelbrot, yalnızca bu varsayıma dayanarak, kullanım sırasına göre düzenlenmiş bu "sözcüklerin" i-incisinin oluşma olasılığının formülle ifade edilmesi gerektiğini gösterdi.
p(r) = j P(r + 7) - s . (12.5)
Sabitler ve V farklı harf ve boşlukların olasılıkları biliniyorsa bulunabilir. B sabiti birden büyük olmalı ve P değeri öyle olmalıdır ki olasılıkların toplamı pj(r) tüm “kelimeler” bire eşitti.
Bunu görmek kolaydır, eğer V çok küçüktür ve B bire çok yakındır, o zaman formül (12.5) pratik olarak Zif yasasının orijinal formülasyonuyla örtüşür. Şekil 1'de 45°' lik bir açıyla çizilen düz çizgi C'nin aksine . 12.6, ifade (12.5), grafiğin sol üst kısmında daha düz ve sağ alt kısmında daha dik olan bir eğri verir. Çoğu durumda, böyle bir eğri, gerçek metinler için elde edilen verilerle, orijinal formülasyonundaki Zif yasasına göre daha iyi uyuşur.
Bununla birlikte, açıklanan rasgele süreçte elde edilen "sözcüklerin" uzunluğunun, gerçek bir İngilizce metnin sözcüklerinin uzunluğuna karşılık gelmediği kanıtlanmıştır.
Ayrıca, dilin özellikleri elbette tesadüfi değildir. Kelimeler yaygınlaştıkça kısalır. Örneğin, taxi ve cab kelimeleri taxicab kelimesinden , cab (cab) kelimesi Cabriolet (cabriolet) kelimesinden türetilmiştir . Harflerin tesadüfen yaratılması Zif yasasını karşılayan "kelimelerin" ortaya çıkmasına neden oluyorsa, bu yasanın kendisini açıklıyor diyebilir miyiz? Bana öyle geliyor ki, bu ancak gerçek bir dili oluşturan hangi güçlerin yukarıda açıklanan rastgele süreci taklit ettiğini gösterebilirsek ileri sürülebilir.
Değiştirilmiş Zief yasasını türetmenin başka bir yolunun temeli, Mandelbrot'un kelime frekanslarının belirli bir süre için bilgiyi maksimize ettiği varsayımıydı. Basitleştirmek için, Mandelbrot her harfe belirli bir süre atadı ve her kelime için (yani boşlukla biten her bir harf dizisi için) harcanan sürenin harfler için harcanan sürenin toplamına eşit olduğunu varsaydı. o kelime Bu, onu ilk varsayımla aynı sonuca, yani formül (12.5)'e götürdü. Ancak bu formülde yer alan sembollerin anlamı değişmiştir. İzin verilen toplam kelime sayısı sonluysa, B sabiti birden az olabilir.
|ГЕ ∂δ СміслоКі ortak P, V dikkate alındığında ve P (12.5)' te , istersek onlara öyle değerler verebiliriz ki, bu formül tarafından açıklanan eğri, gerçek bir metinle yapılan bir deneyin verileriyle en iyi şekilde eşleşir. Tabii ki, bu şekilde V = O, B = I'den daha iyi bir eşleşme elde edebilirsiniz. (orijinal haliyle Zif yasasına karşılık gelir). Ve aslında, uygulamanın gösterdiği gibi, P, V değerlerinin uygun seçimi ile ve (12.5) ifadesindeki B , birkaç istisnai durum dışında, çok iyi bir uyum elde etmek hemen hemen her zaman mümkündür. Modern 1930 İbranicesinde ve dillerin bir karışımı olan Pensilvanya Hollandacasında, deneyle en iyi uyum birden az B ile elde edilir.
Mandelbrot'a göre bir sözlüğün zenginliği esas olarak B sabitiyle ölçülür; B birden fazlaysa, bu, dilde az sayıda kelimenin kullanıldığı ve B'nin bire yakın olması durumunda, kelime dağarcığının çok daha çeşitli olduğu anlamına gelir. Mandelbrot, çocuklar büyüdükçe B'nin değerinin 1,6'dan 1,15'e , hatta çocuğun aniden James Joyce olduğu ortaya çıkarsa 1'e düştüğünü fark etti.
(12.5) ifadesi, orijinal haliyle Zif yasasına göre gerçeklikle daha iyi uyum sağlar. Burada, orijinal haliyle Zif yasasına göre, makalenin ortaya çıkma olasılığının metin pasajının uzunluğuna bağlı olması gerçeğiyle ilgili zorluğun üstesinden gelmeyi başardık. Ancak bu, formül (12.5) 'in Mandelbrot tarafından türetilmesinin ve açıklanmasının mutlaka doğru olduğu anlamına gelmez . Ayrıca, diğer bazı matematiksel ifadelerin gerçek metinle daha iyi uyum sağlaması da oldukça olasıdır. Bu sorunu çözmek için çok daha derinlemesine araştırmalara ihtiyaç vardır.
Zif Yasası sadece kelimelerin kullanımıyla ilgili olarak değil, diğer birçok durumda da geçerlidir. Dolayısıyla çoğu ülkede bu yasa, nüfusun şehrin büyüklüğüne bağımlılığı için geçerlidir. Örneğin, en büyük onuncu şehirde, kural olarak, ülkenin en büyük şehrinde olduğundan on kat daha az insan vardır, vb.
çeşitli vesilelerle gerçekleştirilen sadece bir tesadüf olabilir. Ters kare yasası, yerçekimi çekimi ve Güneş'ten farklı mesafelerde ışık yoğunluğundaki değişiklik için geçerlidir ve yine de bu iki yasa herhangi bir genel teoriden türetilemez.
Bilgiyi algılama ve işleme yeteneğimizin sinir sisteminin özellikleriyle sınırlı olduğu oldukça açıktır. Bir örnek, George Miller'ın 7 artı-eksi 2 yasasıdır; bu yasa, kısa bir gözlem süresinde, bir kişinin ikili veya ondalık basamaklar, harfler veya tanıdık sözcükler gibi 5 ila 9 tanıdık nesnenin adını hatırlayabildiğini ve tekrarlayabildiğini belirtir. .
Bir taşistoskop kullanarak çok kısa bir süre için özneye parlak bir şekilde aydınlatılmış bir görüntü göstermek mümkündür. Kendisine birkaç kanlı fasulye resmi gösterilirse, sayıları 9'u geçene kadar numaralarını doğru bir şekilde adlandırabilecektir. Böylece, her flaşta yalnızca 10 sonuç ( 0'dan 9'a ) iletilebilir. Bu durumda iletilen bilgi miktarı Iog 10 veya 3.3 bittir.
7 basamağı hatırlayabilir ve tekrar edebilir , yani iletilen bilgi miktarı 7 bittir.
5 Iog 26 olan 4 veya 5 harfi hatırlayabilecek veya bilgi miktarı yaklaşık 23 bittir.
Denek muhtemelen 3 veya 4 kısa iyi bilinen kelimeyi hatırlayabilir, yani 7-2'den biraz daha az. Bu kelimeler en yaygın 500 kelimeden seçilirse , bilgi miktarı 3 Iog 500 veya 27 bittir.
Kelimeleri okuma denemelerinde olduğu gibi, görevin karmaşıklığının artmasından elde edilen kazanç, algılanan nesnelerin sayısının azaltılmasından kaynaklanan kayıptan daha ağır basar ve karmaşıklık arttıkça bilgi de artar.
Hem Miller'ın "7 artı-eksi 2" yasası hem de okuma hızı deneyleri araştırmacılar için çok kafa karıştırıcı. Bir kişi herhangi bir resimden yalnızca 27 bitlik bilgi algılıyorsa , aynı 27 bitlik görüntüyü kullanarak 288 bitlik bir görüntü iletmek mümkün müdür?
ekran projeksiyonu orijinaliyle tatmin edici bir şekilde eşleşir mi? Okuma hızını belirlemeye yönelik deneylerin kanıtladığı gibi, bir kişi saniyede yalnızca yaklaşık 40 bit bilgi iletebiliyorsa , o zaman saniyede yalnızca 40 bit ile tatmin edici bir televizyon görüntüsü veya insan sesi iletimi elde etmek mümkün müdür?
Her iki durumda da cevabın hayır olması gerektiğine inanıyorum. Sorun ne? Gerçek şu ki, bir hata yaptık: Bir kişinin "çıktısını" ölçtük ve hiçbir şekilde "girdisini" ölçemedik. Belki bir anlamda insan saniyede sadece 40 bit bilgi alıyor ama aynı zamanda neye dikkat edeceğini ve neyi hatırlayacağını seçebiliyor. Örneğin bir kıza dikkat edebilir veya sadece elbisesini fark edebilir. Görünüşe göre, çok daha fazlasını fark ediyor, ancak gereksiz olan her şey, daha söyleyecek vakti olmadan kafasından uçup gidiyor.
İki psikolog, E. Averbek ve G. Sperling, bu konuyu benzer yöntemlerle araştırdılar. Bir taşistoskop yardımıyla, ekrana önemli sayıda (16 veya 18) harf yansıttılar ve flaşın bitiminden kısa bir süre sonra (saniyenin kesirleri) süjeye bir sinyal verdiler. işaretçi veya ses, hangi harfin çağrılması gerektiğini. Denek herhangi bir harfi doğru bir şekilde adlandırabilirse, işaretçi rastgele gönderildiği için tüm harfler "hatırlanmış" kabul edildi.
Bu deneylerin sonuçları, bir kişinin saniyenin onda birkaçında "7 artı veya eksi 2" nesneden çok daha fazlasını hatırlayabildiğini gösteriyor. Görünüşe göre, "7 artı-eksi 2" nin bu nesnelerden uzun süreli belleğe aktarımı, yaklaşık bir nesnenin saniyenin yüzde birinde veya tüm nesnelerin saniyenin onda birinden daha kısa bir sürede gerçekleştirilebilir. Aktarılan nesneler bu diğer bellekte birkaç saniye saklanabilir. Görünüşe göre, bize Miller yasasının "7 artı - eksi 2" rakamını veren, bu uzun süreli belleğin sınırlı boyutudur.
İnsan davranışı ve hafızasının özellikleri o kadar ilginç ki, aramaya devam edebilirsiniz.
θ J. Pierce
bilgi teorisi ve psikoloji arasındaki ilişkiler. Bu geniş alandan seçilmiş birkaç soruyu ele aldık. Ancak yine de bilgi teorisinin psikoloji için gerçekten faydalı olup olmadığı veya başka bir şekilde tanımlanabilecek gerçekleri sunmanın farklı bir yolu olup olmadığı sorulabilir. Şahsen, bilgi teorisinin psikologlara bilgi aktarım süreçlerine ilişkin önemli yeni içgörüler ve görevlerin karmaşıklığını değerlendirmenin önemli yeni bir yolunu sağladığını düşünüyorum. Bilgi teorisi, psikologlarda merak uyandırdı ve onları eski verileri yeniden gözden geçirmeye ve yenilerini aramaya zorladı. Bununla birlikte, bana öyle geliyor ki, eğer bilgi teorisi elektriksel iletişim teorisinde merkezi bir rol oynuyorsa, o zaman psikoloji için hala sadece merak uyandırıyor. Ayrıca bilgi kuramı, diğer alanlarda çalışan insanların kelime dağarcığına bazı parlak yeni ifadeler eklemiştir.
On Üçüncü Bölüm
BİLGİ TEORİSİ
VE
SANATI
Bell Telephone Company'nin laboratuvarlarını ziyaret eden çok yetkili bir modern besteci, müzikal seslerin ve sadece seslerin değil, tüm müzik eserlerinin bir sayı dizisi olarak temsil edilebilmesine şaşırdı. Bizim için, elbette, bu ortak bir şey. Darbe kodu modülasyonu yardımıyla herhangi bir elektriksel salınımın bir dizi okuma ile temsil edilebileceğini biliyoruz.
Ama bestecinin gözünden kaçan bazı önemli şeylerden bahsettik. 15.000 Hz bant genişliğine sahip yüksek kaliteli bir müzik gösterimi için saniyede 30.000 örnek alınmalı ve her örnek yaklaşık yüzde onda bir doğrulukla alınmalıdır . Bu, her numunenin genliğini üç ondalık basamakla (veya yaklaşık on ikili basamakla) görüntüleyerek yapılabilir.
30.000 üç basamaklı ondalık sayıdan oluşan bir dizi oluşturabilseydi, ses seçiminde tam bir özgürlüğe sahip olurdu . Sayısı bir ve ardından 108 milyon sıfır olarak yazılabilen çok çeşitli 20 dakikalık parçalar arasından seçim yapması gerekecekti - hayal bile edilemeyecek bir sayı! Başka bir deyişle, bu müzik besteleme yöntemiyle seçim saniyede 300.000 bit olacaktır.
Okuyucunun hatanın nerede yapıldığını zaten tahmin ettiğine inanıyorum. Düşündüğümüz en hızlı yöntemi kullansak bile, yani kelime listelerini olabildiğince hızlı okusak bile, saniyede 40 bitten fazla olmayan bir bilgi aktarım hızı elde edebileceğimizi zaten belirtmiştik - saniyede on binde biraz daha fazla bestecimizden istenen hız .
saniyede 40 bitten bile daha düşük hızlarda algılayabilir . Bir aktörün konuşmasını dinlediğimizde, oldukça makul bir hızda yapılan çok gereksiz bir konuşma duyarız.
Kısacası, bir bestecinin eserleri bir dizi okuma şeklinde besteleme konusundaki esnekliği ve özgürlüğü boşa gitmiş olacaktır. Besteci daha sonra dinleyicilerin hiçbirinin birbirinden ayırt etmeyeceği ve ilginç bulmayacağı birçok "eser" bestelemek zorunda kalacak. Matematiksel bir bakış açısından , tüm frekansları eşit dozda içeren beyaz Gauss gürültüsü, çeşitliliğin ve sürprizin zirvesidir. Tüm ses kaynakları arasında en az tahmin edilebilir olanıdır. Ancak bir kişi için beyaz Gauss gürültüsü aynı geliyor, gürültünün ince farklılıkları dinleyiciden gizli kalıyor ve ona sıkıcı ve monoton geliyor.
Bir kişi, matematiksel bir bakış açısından en çeşitli ve beklenmedik olanı monoton bulursa
W
ama o zaman neyi taze ve ilginç buluyor? Bir şeye yeni diyebilmek için onu eskisinden ayırt edebilmek gerekir. Ve ayırt edilebilir olmak için, seslerin bir dereceye kadar tanıdık olması gerekir.
Her bir arkadaşımızı tarif edebiliriz, her birinin özel özelliklerini değerlendirebiliriz ama yabancılarda çok daha az karakteristik buluruz. Elbette, Gauss gürültüsünü romantik müzikten ayırt edebiliriz, ancak bu pek yardımcı olmuyor çünkü herhangi bir Gauss gürültüsü bize aynı geliyor.
18. yüzyıl müziğinin çoğu kulağa neredeyse aynı geliyor. Onlar için Grieg'in Holberg Süiti, gerçekte yalnızca yüzeysel bir benzerlik olmasına rağmen, 18. yüzyıldan kalma bir müzik gibi görünebilir . Ve 18. yüzyıl müziğine aşina olanlar için 16. yüzyıl koroları tekdüze ve monoton görünebilir. Karşı örnekleri de biliyorum. Bazı Mozartistlerin Verdi'yi monoton bulduğunu biliyorum ve Verdi'yi sevenler için modern müziğin çoğu monoton bir kakofoni gibi geliyor.
Elbette bir besteci özgür ve özgün olmak ister ama yine de tanınmak ister. Dinleyiciler bir bestesini diğerinden ayırt edemiyorsa, o zaman doğal olarak farklı eserlerin olduğu plakları satın almayacaklardır. Eserlerini bütün bir besteciler okulunun eserlerinden ayırt edemeyecekleri için, büyük olasılıkla, bir numune için satın alınan tek bir plakla yetineceklerdir.
Peki bestecinin dinleyicinin eserlerini tanıması için ne yapması gerekiyor? Bunu ancak entropilerini (bilgi yaratma hızı), çeşitliliklerini insanın ayırt etme yeteneğinin sınırları içinde tutarak ve bu çeşitliliğin küçük dozlarda, saniyede birkaç bit hızında uygulanmasıyla başarabilir. halkın sunulan eserlerin çeşitliliğini anlaması beklenebilir.
Bu, tabiri caizse "bilgi kuramından bir besteci"nin bestelerinin rastgele seçilmiş notalardan oluşan basit ve yavaş diziler olacağı anlamına mı geliyor? Tabii ki hayır, en azından bir edebi eserden daha fazlası rastgele bir harf dizisidir. Büyük olasılıkla besteci, bestelerinde dinleyicilerin diğer eserlerden zaten aşina olduğu teknikleri kullanacaktır. Üstelik bunları, dinleyicinin her zaman kafası karışmayacak, bundan sonra ne olacağını tahmin edebilecek şekilde kullanacaktır. Belki de besteci zaman zaman (her zaman değil) tamamen yeni araçlar sunarak dinleyicilerini şaşırtacaktır. Yenilikleri idareli ve dikkatli bir şekilde tanıtacak ve onları dinleyiciye tanıttıktan sonra, onları biraz değiştirilmiş biçimlerde tekrarlayacaktır.
Dil ile bir benzetme yaparak, bestecinin dinleyicilerin zaten aşina olduğu bir dilde yazacağını söyleyebiliriz. Müzikal "sözcükleri" müzik grameri kurallarına göre uyumlu hale getirecektir. Bu kelimeler zaten bilinen akorlar, diziler, temalar veya süslemeler olabilir. Cümleler veya kıtalar gibi, genellikle sık tekrarlarla birbirini takip edecekler ve orkestranın zaten tanıdık sesleri tarafından icra edilecekler. Bestecimiz iyi bir besteciyse, eğitimli dinleyiciyi kesinlik ve bireysellik izlenimiyle bir şekilde etkileyebilir. Ve sadece yetkin bir besteci olsa bile besteleri yine de anlaşılır ve keyifli olacaktır.
Elbette burada söylenenlerde yeni bir şey yok. Bu, hakikat* başka bir deyişle ve bilgi teorisine tamamen aşina olmayan kişiler tarafından söylenebilir. Bununla birlikte, bu bilgi özellikle şimdi, besteciler ve diğer sanatçılar da onları cezbeden, bazen rahatsız eden ve biraz korkutan çok sayıda teknik araçla karşı karşıya kaldıklarında yararlı olacak gibi görünüyor.
Doğal olarak, onlar için ilk cazibe, çok özgür ve geniş bir seçim olasılığıdır. Bell Telephone Laboratories'den M. Mathews, bir elektronik bilgisayarın delikli kartlara kaydedilmiş bir dizi talimata yanıt olarak istenen herhangi bir şekilde salınımlar üretebilmesi gerçeğiyle ilgilendi. Her delikli kartla bir nota - titreşimin şekli, perdesi ve hacmi - kodlamasına izin veren bir program derledi. Kazandığı özgürlükten esinlenerek, makineye neredeyse imkansız nota kombinasyonlarından oluşan hızlı ritmik pasajlar çaldırdı - örneğin, alışılmadık bir aksan dağılımına sahip dörde karşı üç nota. Bu ustaca egzersizler kulağa kaotik geliyordu.
somut müzik yöntemlerini kullanarak en çeşitli ve değiştirilmiş seslerin kayıtlarını oluşturarak, dinleyicide bir müzik parçası dinliyormuş izlenimi vermeyi başarırlar. Elektronik cihazların ürettiği seslerin kullanıldığı “hassas” eserler çoktan yazıldı. Ancak besteci, geleneksel yöntemlerden ayrılma konusunda zorluklarla karşılaşmaktadır.
Alışılmışın dışına çıkmak isteyen bir bestecinin önünde hangi fırsatlar açılır? Dinleyicisini kaybetmemek için eserlerini büyük ölçüde sadeleştirebilir ve geleneksel tarzda yazılmış eserlere yaklaştırabilir. Ayrıca izleyiciye kendisi ve diğer besteciler tarafından icat edilen yeni cihazları hatırlamayı ve ayırt etmeyi öğretmeye çalışabilir. Ve son olarak, besteci yanlış anlaşılmayı tercih edebilir ve yalnızca gelecek nesillerden tanınmayı bekleyebilir. Başka olasılıklar da olabilir; besteci gerçekten parlaksa, şüphesiz ortaya çıkacaklar.
Bilgi kuramı sanata somut bir şey sunabilir mi? Bunun yeni bir bakış açısı dışında ciddi bir şey olduğunu düşünmüyorum ama bu bölümün geri kalanında bunun üzerinde durmanın mantıklı olduğunu düşünüyorum.
3, 6 ve 12. bölümlerde dil hakkında konuştuk. Bir dil, bir alfabeden veya kelime dağarcığından ve gramer kurallarından veya dilbilgisi açısından doğru metinde kelimelerin kullanımına konulan kısıtlamalardan oluşur. Bir metnin kelime ve dilbilgisi kurallarından kaynaklanan özelliklerini ve yazarın veya konuşmacının fiili seçimine bağlı olarak özelliklerini ayırt etmeyi öğrendik. Kelime başına ortalama bilgi miktarına katkıda bulunan dil tarafından sağlanan bu seçimdir. Görüldüğü gibi Shannon'a göre kelime başına 3.3 - 7.2 bit aralığındadır . Bu değer aynı zamanda yazarın veya konuşmacının herhangi bir semantik anlamı iletmesine izin veren bir seçim olmalıdır.
12. Bölümde gördüğümüz gibi , metnin büyük bir kısmı nispeten az sayıda kelimeden oluşur. Dilbilgisi kuralları o kadar karmaşıktır ki tam olarak formüle edilemezler. Bununla birlikte, çoğu insanın geniş bir kelime dağarcığı vardır ve gramer kurallarını doğru bir şekilde dilbilgisi yazabilmeleri anlamında bilirler.
Müziği dikkatli ve eleştirel bir şekilde dinleyen herkesin, müzikal unsurları ve aralarındaki ilişkiyi de bildiğini varsaymak mantıklıdır. Nasıl ki doğru yazan bir kişinin gramer kurallarını formüle edebilmesi için gerekli olmadığı gibi, dinleyicinin de bu kuralları formüle edebilmesi elbette gerekli değildir. Evet ve dinleyiciden müzik yazabilmek, konuşmadan anlayan aptal bir kişinin konuşmasından daha fazla gerekli değildir. Ancak dinleyici bir anlamda kuralları bilir ve müziği dinlerken bu bilgilerini uygulayabilir.
Belirli bir halkın, çağın veya okulun müziğinin unsurlarına ve kurallarına olan bu aşinalık, benim "müzik dili bilgisi" veya müzik tarzı dediğim şeydir. Ancak bu müzik kurallarının ne kadarı fizik yasalarına dayalı olsun ya da olmasın, müzik dili bilgisi, konuşma dili bilgisinin yanı sıra ancak yıllarca uygulama ile elde edilir. İster edebi ister müzikal olsun, bir eserin tarzını ve bireyselliğini ayırt etmeyi yalnızca uygulama mümkün kılar. Hazırlıksız dinleyici için müzik, önceden bilinen sınırlı bir ses sınıfından değil, sonsuz sayıda olası tüm seslerden seçilen bir ses setidir. Hazırlıksız dinleyiciye, müzik yasalarının mekanik uygulaması, seçim ve çeşitliliğin bir tezahürü gibi görünecektir. Bu nedenle, deneyimsiz dinleyici veya yalnızca başka bir müzik diline aşina olan dinleyici, müziğin görünürdeki karmaşıklığı karşısında şaşkına dönecektir.
Unutulmamalıdır ki, dilbilgisi yasalarını bir dereceye kadar ihlal ederek, yine de net bir şekilde yazabiliriz. Mesela "Kocamanım" diyebilirsiniz. Bu ifadenin anlaşılırlığı, bazı garip müzikleri anlama yeteneğimizle karşılaştırılabilir, ancak bize tamamen yabancı değildir. Ayrıca, dilbilgisi kurallarına sıkı sıkıya bağlı kalarak saçma sapan yazılabileceğine de dikkat edilmelidir (“Alçı kelime sessizce s?6
diyor porfiriye). Detaylandırmak istediğim, bu ikinci olasılık üzerine. Ancak, öncelikle belirtmek isterim ki akıllı şeyler yazabilir ve tüm gramer kurallarına uyabilirsiniz, ancak yine de yazılanların anlamı geniş bir okuyucu kitlesi için yeterince açık olmayacaktır.
Bilinen kelime dağarcığını ve kelimeleri bağlamak için bazı veya birçok kuralı koruyarak anlamı neredeyse tamamen ortadan kaldırmanın mümkün olduğu bilinmektedir. Böylece Mozart , gelecek nesillere 3/8'lik bir dizi sınıflandırılmış ve numaralandırılmış ölçüler ve bunların bağlantısı için bir dizi kural bıraktı. Ve bu kurallara uygun olarak, rastgele seçilen (en azından zar atarak) önlemler birleştirilirse, o zaman tam bir meslekten olmayan kişi bile, kulağa tuhaf bir şekilde "düzensiz" gibi gelen neredeyse sınırsız sayıda küçük vals "besteleyebilir". ” Mozart. Böyle bir "kompozisyon"un bir örneği Şekil 2'de gösterilmektedir. 13.1. Bazı insanlar Joseph Haydn, Maximilian Stadler ve Carl Philipp Emanuel Bach'ın tam da bu tür "tesadüfi" müzikler yazdıklarını düşünüyor. Ve daha yakın zamanlarda John Cage, not dizilerini seçmek için rastgele işlemler kullandı.
Henüz bu tür ünlü seleflerin farkında olmayan Betty Shannon (Claude Shannon'ın karısı) ve ben 1949'da ilkel istatistiksel veya başka bir deyişle stokastik müzik bestelemeye başladık. Öncelikle , Do majör anahtarında • I'den VI'ya izin verilen akorların bir listesini derledik . Aslında listeye sadece birinci dereceden akorlar dahil edilmiş, geri kalanı kurallara göre onlardan türetilmiştir. Bu amaç için özel olarak yapılmış üç KQQτp atmak ve ardından
bir rastgele sayılar tablosu kullanarak birkaç "iş" yazdık.
Bu eserlerde akorları birbirine bağlamanın tek kuralı, aynı sesteki ardışık iki akorun aynı tuşa sahip olmasıydı. Sonuç olarak, geri kalan sesler en vahşi ve inanılmaz şekilde gelişti. Bölüm 3'te gösterildiği gibi , basit ve doğru ancak yetersiz digram olasılıkları kullanılarak sentetik metin üretilirken benzer bir şey olur.
Bu eserlerin mikro yapıları çok ilkel olmasına rağmen, onlara gerçekten iyi ve akılda kalıcı bir makro yapı verilmeye çalışılmıştır. Böylece, her kompozisyon , her biri dört çeyreklik 8 ölçekten oluşuyordu . Makro yapı, 5. ve 6. çubukların 1. ve 2. çubukları tekrar etmesiyle elde edildi , ancak 3. ve 4. çubuklar, 7. ve 8. çubuklardan farklıydı . Sonuç olarak, bu eserler ilkel bir rondo tarzında yazılmıştır. Ayrıca, bir kadenza efekti elde etmek için akorlar, 1, 16 ve 32 numaralı akorlar I dereceden ve 15 ve 31 numaralı akorlar - IV veya V dereceden inşa edilecek şekilde seçildi .
Resmi olarak bu eserler rondo olarak adlandırılabilse de, daha çok kilise ilahileri gibiydiler. Bunlardan birini Şekil l'de çoğalttım. 13.2. Her kilise ilahisinin bir başlığı ve sözleri olması gerektiğinden onları da besteledim ama burada zar kullanmadan. Çalışmaların geri kalanı yukarıdakilere çok benziyordu. Hepsinin aynı besteciye ait olduğu açıktır. Ancak birkaç dinlemeden sonra birbirlerinden ayırt edilebilirler. Ve bir kez alıştığımda, onlara aşık olmayı bile başardım. Bozulmamış bir müzisyen için kulağı kesmeleri gerekir.
1951'de bir bilgi teorisyeni olan David Slepyan (kendisinden daha önce bahsedilmişti) biraz farklı bir yol izledi. Shannon'ın erken dönem çalışmalarından birinin ardından, müzik eğitimi almamış ve eline geçen ilk matematikçilerin müziğinin gizli istatistiksel bilgisine başvurdu. Böyle bir " konu " gösterdi 1/4 , 1/2 veya 3 / 2 ölçüleri ve kendi takdirine bağlı olarak sonraki 1 / 2'yi eklemesini önerdi incelik Sonra , eklenen 1/2 dahil olmak üzere aynı pasajı başka bir kişiye gösterdi . incelik, başka bir 298 var
Rastgele
O Noel günü rastgele düşüncelere daldığımda , onlar önceden mi ?
Yoksa bizden mi öğrendiler 8 Ing
Beth -lehem'de ve o yıldızda Çocuk Mesih'i büyüttü ve Mesih inkar etti Bir - geis'in be - fore şarkı söylediği günü
⅜ 4■ √-¼¾ ben ∙ j r
Uzaklardan üç bilge adamı çeken Ve Mesih'in tepsiye dizildiği ve çarmıha gerildiği Ve taşıdıkları hediyeleri bıraktığı
Bilge adamların ne düşündüğünü merak ettim . _ _ _ _ _ _
Hediyelerimizi ve araba sürmeyi önceden söylemek mi ?
Resim. 13.2.
koro
bir koronun karakteristiği ve romantik müziğin özelliği.
Slepyan'ın deneyi, insanın inanılmaz uyum sağlama yeteneğinin yanı sıra bazı zayıflıklarını da gösterdi. Tamamen stokastik süreçlerin daha tutarlı, ancak sıkıcı olduğu söylenmelidir. Sayıların yardımıyla müzik yazmaya çalıştılar.
Kuşkusuz, bir bilgisayar yardımıyla, bestecinin tarzını açıklayan uygun istatistikler uygulanarak, bu bestecinin tarzında "rastgele" müzik yazmak mümkün olacaktır. Bu olasılık, Pinkerton'ın sergilediği ninni tarzı ve Hiller ile Isakson'un dikkate aldığı çeşitli tarzlarla örneklendirilir ve şimdi bundan bahsedeceğim.
1956'da Richard Pinkerton, Scientific American'da bazı basit melodi yazma teknikleri yayınladı . Belirli bir önceki notadan sonra gelme olasılığını kullanarak bir notanın nasıl seçilebileceğini ve bu olasılıkların notun çubuktaki konumuna nasıl bağlı olduğunu gösterdi. Ninnilerin ezgisinin analizinden elde ettiği olasılıkları kullanarak nota başına düşen entropi miktarını hesaplamış ve bunun 2,8 bit olduğu ortaya çıkmıştır. Yalnızca iki ardışık notanın oluşma olasılıkları dikkate alındığından, bu değerin 1 bit fazla tahmin edildiğine ikna oldum . Pinkerton ayrıca, Şekil 1'de gösterilen makine gibi basmakalıp melodiler üretebilen sonlu sayıda duruma sahip basit bir makine önerdi. 3.1 (s. 71), "teklifler" oluşturur.
1957'de F. Brooks, A. Hopkins, P. Neumann ve W. Wright, kilise ilahi melodilerinin istatistiklerine ilişkin geniş bir araştırmaya dayanan , müziğin istatistiksel kompozisyonunun olasılığı hakkında bir rapor yayınladılar.
1956'da Burroughs Corporation , müzik bestelemek için bir bilgisayar kullanıldığını bildirdi ve 1957'de Martin Klein ve Douglas Bolitho'nun Datatron bilgisayarını "popüler" melodiler bestelemek için kullandıkları açıklandı. Bunlardan biri Jack Owens tarafından yazılmış ve "Bertha Push the Button" adlı bir ABC programında yayınlandı. Doğal olarak, pek çok kişi bu alanda münzevi olmaya başladı.
Yine de Illinois Üniversitesi'nden Hiller ve Isakson, bilgisayarla müzik yaratmak konusunda gerçekten ciddi bir deney yaptılar. Kontrpuan kurallarını, bilgisayarın notaları rasgele seçebileceği ve bu kurallarla çelişirse notları atabileceği şekilde formüle etmeyi başardılar.
Kurallar çoğunlukla yalnızca üç nota arasındaki ilişkiyi hesaba kattığı için, kısa pasajlar kulağa alışılmadık derecede iyi gelse de parça tutarsızdı. Böyle bir ürünün bir örneği Şekil l'de gösterilmektedir. 13.4 .
Ek olarak, Hiller ve Isakson, bilgisayarın ilginç ritmik pasajlar bestelemek için kullanılabileceğini ve ayrıca bir sonraki notanın seçiminin hesaplanan olasılık işlevlerine bağlı olduğu "Markov zResimleri" tarzında müzik bestelemek için kullanılabileceğini göstermeyi başardılar. çeşitli armonilerin (harmonikler) hesaplanması sonucunda elde edilen tablolara. Böylece basit bir tarifi izleyerek kodu almayı başardılar.
Sonra hepsi Illiac Suite for String Quartet adıyla yayınlandı. Şeklinde
Resim. 13.4,
bu haliyle, bu müzik iyi bir yerel yapıya sahiptir, ancak genel olarak zayıf ve gevşektir. Basit bir kompozisyon modelinin eklenmesi veya tekrarların eklenmesi konuya büyük ölçüde yardımcı olabilir. Ancak tüm bunlar, bir rondodaki zorunlu tekrarlar gibi katı bir şekilde deterministik olacaktır veya 6. bölümde tartıştığımız Chomsky'nin gramerine benzeyecektir . nota digramlarının, üç gramın vb. oluşma olasılıkları üzerine. D aptaldır. Yalnızca notları değil, aynı zamanda çalışmanın ayrı bölümlerini de bağlamanız gerekir .
Hiller ve Isakson'un çalışması, bir bilgisayarın daha önce yalnızca insanlar tarafından kullanılabilen müzik besteleme tekniklerinin çoğunu tekrarlayabileceğini ikna edici bir şekilde gösterdi. Bir besteci, özellikle de çok deneyimli olmayan biri, kalıplaşmış ve sıkıcı işlerin çoğunu başarıyla bilgisayara emanet edebilir. Makineye sadece işin ana temasını verebilir ve üslubun veya dönemin özelliklerine göre armoni ve kontrpuan detaylarını geliştirmeyi bırakabilir. Sonra, hesapla
Jel mashiya, bestecinin aşina olmadığı kontrpuan veya uyum kuralları gibi yeni kompozisyon kurallarını test etmek için kullanılabilir.
Sibernetiğin yakında bize öğrenen makineler vereceği sık sık söylenir. Ama kelimenin tam anlamıyla öğrenebiliyorlarsa, o zaman neden bizim bilmediğimiz şeyleri bile öğrenmesinler? Böylece, başarı için “ödüllendirme” veya başarısızlık için “cezalandırma” ile böyle bir öğrenen bilgisayar, “İspanyol müziği”, “klasik müzik”, “rock and roll”, “kolay” etiketli bir düğmeye bastığınızda emin olmak mümkün olacaktır. müzik” vb. butonda yazanları aynen bestelerdi. Bu tür düşünceler heyecanlandırmaktan başka bir şey yapamaz, ancak ne yazık ki, şu anda henüz gerçek değiller ve görünüşe göre, uzun süre böyle kalacaklar.
Ancak müzik tüm sanat değildir. Müzikle başladım çünkü bilgi teorisinin bazı fikirlerini alışılmadık bir ışık altında göstermek zor değil. Daha az başarı olmadan , aynı şey dili örnek olarak kullanarak yapılabilir. Gerçekten de, stokastik metin oluşturma deneyleri, müzik deneylerinden daha geniş çapta gelişmiştir.
Büyük Lagoda Akademisi profesörü, Kaptan Gulliver'e, çevresine kelimelerin yazıldığı bir eksen üzerine monte edilmiş disklerden oluşan, kelimeler yaratmak için bir cihaz gösterdi. Profesör keyfi olarak bu diskleri çevirdi ve ortaya çıkan kelimeler dizisinde yeni bilgelik aradı.
Bu, metin oluşturmada stokastik sürecin kötüye kullanılmasına bir örnektir. Elbette bu şekilde yeni bilgiler edinemeyeceğiz. Doğrulanmamış bir rasgele işlem sözcüğüne kimin ihtiyacı var? Ve çok fazla asılsız iddia ortaya atıldı; neyin doğru neyin yanlış olduğunu bilmemiz gerekiyor.
Yine de, stokastik süreç bazı ilginç etkiler yaratabilir. 3. Bölümde , Shannon'ın İngilizce metne yaklaşımlarından bahsettik. Bu yaklaşımlar, digram ve trigramların tekrarlama frekansları ve bir rasgele sayılar tablosu kullanılarak elde edildi. Aralarında ilginç "sözler" olduğunu zaten gördük.
Deamy kelimesi bana hoş geliyor ; "Bu harika bir fikir" ifadesini bir iltifat olarak anlamak isterim . Ama bana aptal deseler öfkelenirdim .
Ve bana kaba denilmek istemiyorum ; belki de bu "sözcük" bana gros (kaba), bakkaliye (bakkaliye) ve gravid (hamile) kavramlarını hatırlatıyor . Pondenome kelimesi ne anlama gelirse gelsin, kulağa en azını söylemek görkemli geliyor.
Burada Shannon'ın ikinci dereceden kelime seviyesindeki yaklaşımını veriyorum:
Bir İngiliz yazara kafadan ve cepheden saldıran bu noktanın karakteri bu nedenle mektuplar için başka bir yöntem ki o zamanın hiç beklenmedik bir problem olduğunu anlattı. (Bu noktada karakteri olan İngiliz yazara kafadan ve cepheden bir saldırı, bu nedenle, bu konuda şimdiye kadar kimsenin konuştuğu mektuplar için başka bir yöntem, beklenmedik durumlar içindir.)
Bunda rahatsız edici, tehdit edici bir şey buluyorum. İngiliz yazarın ölümcül bir tehlikede olduğunu hissediyorum, ancak mesajın ikinci kısmı çarpıtıldığı için yardımına koşamam.
Daha az bozuk metin arayışıyla, 6. bölümde bahsettiğim gibi, bir kağıt parçasına alt alta dilbilgisi açısından ilişkili üç kelime yazdım. Onları bir arkadaşıma gösterdim ve ondan bu kelimeleri içeren bir cümle bulmasını ve ardından bu cümleye bir sonraki kelimeyi eklemesini istedim. Sonra en üstteki kelimeyi kapattım ve kalan üç kelimeyi başka bir arkadaşa göstererek bir kelime daha eklemesini istedim. Bu şekilde yirmi arkadaşla görüştükten sonra şunları elde ettim:
Bir vahşi terk cümbüşünden sonra sabah ağardığında, başının bir dizi kelimeyle dikey olarak hizalanmış olarak salladığını söyledi .
İşte daha yeni örnekler:
Bir gün Dionysos'a gittiğimde erkeksiz kadınların ne düşündüğünü yarı yolda bırakıp iyi bir izlenim bırakmıştım ...
Devam edip etmediğini unuttum . Sonunda bunun hemen ardından durması gerektiğini şart koştu . Onu
en son yaşadığında görmüştüm . Duvara karşı zarafetle sallanan ağaçların buz gibi bir görüntüsü oldu . Asla yapamazsın ... (Defalarca devam edip etmediğini unuttum. En sonunda hemen ardından durmasını şart koştu. Onu en son yaşadığı dönemde görmüştüm. Meğer ayaz ağaçların zarifçe salındıkları görülüyordu. duvar. Asla yapamazsınız...)
4 kelimeden çok daha büyük grupları kapsadığını görüyoruz . Ancak sonunda metin "bağlılığını" kaybetmeye başlar. Böyle bir tutarlılık kaybının makro yapısı, kelime seçiminin yapıldığı temelde nihai bir hedefin veya ifadenin anlamının olmamasıyla açıklanabilir. Bazen şizofrenlerin ifadelerinde buna benzer bir şey buluruz. W. Hudson, The Purple Land (Purple Land) adlı kitabının kahramanlarından birinde daha da büyük bir tutarlılık kaybını harika bir şekilde tasvir etti - Anselmo Amca hikayeyi asla bitiremedi çünkü o her zaman konudan saptı.
Makro yapı, göze çarpan bir yere, örneğin, katılımcıların ne hakkında yazması gerektiğini öneren bir başlık eklediği bir kağıdın altına yazılarak bir dereceye kadar geliştirilebilir.
Stanford Electronics Lab'den Donald Dunn, konunun bir kelime eklerken yalnızca bir önceki kelimeyi gördüğü, ancak konunun başlığını bildiği bazı örnekler verme nezaketini gösterdi:
Men and women
Eve Ioved intensely sentimen- tal or not sufficient to night whe- rever you may die before yes- terday again and whatever m’lo- ve misb⅛aves.
The seduced are Compatible unusual family Iife seemed won- derful experience for tendemess forever yours.
Orphans frequently visited his promiscuity and infidelity despitehate and Iove for tornor- row sex ain,t nothing.
Мужчины и женщины
Ева любила очень сентимен- тальное или недостаточно се- годпя вечером где бы вы могли не умереть раньте чем вчера и как бы моя возлюбленная не- верна.
Соблазненные составляют не- обычную семейную жизнь ка- жущуюся прекрасной жизнен- ной школой для нежности на- всегда ват.
Сироты часто посещали его беспорядочность и неверность вопреки ненависти и любить ради завтрашнего секса значит ничего.
Bell Telefon Laboratuarlarında elde edilen aşağıdaki örneklerde, denek bir kelime ekleyerek önceki üç kelimeyi görmüş ve adını bilmiştir:
hayat hakkında
tapuları vardır ve wi- Hayatın pek çok iyi seti vardır, yarım akıllıları nadiren kınarlar ve akıllı insanlar nadiren hafife alırlar ! Neden olmasın diye merak ediyorsun . kolaylıkla aptallık! İnsan duygularını merak ediyorsun ama vahşi neden olmasın. İnsan kabileleri buldu... insani duygular ama vahşi kabileler
kurmak...
Engineers
It is frequently said that they knew why forces might affect salaries. However, ali scientists can’t imagine...
Housecleaning
First empty the furniture of the master bedroom and bath. Toilets are to be washed after polishing doorknobs the rest of the room. Washing Windows se- miannually is to •be taken by small aids such as husbands are prone to omit soap powder.
Murder story
When I killed her I stabbed Claude between his powerful jaws clamped tightly together. Screaming Ioudly despite fatal Consequences in the Struggle for Iife ebbing as he coughed hol- Iowly spitting blood from his ears.
Инженеры
Часто говорят что они знают почему силы могут влиять на зарплату. Однако все ученые не могут представить...
Домашняя уборка
Сначала вынуть все из мебели в хозяйской спальне и ванной. Туалеты должны быть вымыты после полировки ручек дверей остальных комнат. Мытье окон раз в полгода должно быть пред- принято неважными помощни- ками такими как мужья которые склонны забывать о мыльном порошке.
Рассказ об убийстве
Когда я убил ее я ударил Кло- да ножом между его мощными челюстями сжатыми плотно вме- сте. Громко визжа несмотря на фатальные последствия в смер- тельной борьбе ослабевающий когда он кашлял сплевывая кровь из своих ушей.
Bunu gülmeden okumak mümkün değil bence. Yine de biraz hayranlık duyuyorum. Asla yazamazdım: "Duvarın arka planında zarifçe sallanan donmuş ağaçların göründüğü ortaya çıktı." Neredeyse keşke böyle yazabilseydim. Zavallı şairler, gülleri rüyalar, gözyaşları ve gök gürültülü fırtınalarla sonsuz bir şekilde kafiye ederler ve onların son derece bilgili sıradanlıkları asla iyi olarak düşünülemez.
306 ben
⅛ satırlar. Bir anlamda, stokastik süreç daha fazlasını yapabilir; en azından şansı var. Deamy kelimesini kendim düşünmemiş olmam üzücü ; Bunu başaramadım.
Bir bilgisayar, gramer kurallarını ve bir dizi rasgele sayıyı kullanarak herhangi bir edebi değeri olan bir metin yazabilir mi? Belki de yeni ve eğlenceli "sözcükler" ve eğlenceli metin pasajları yaratabilirdi. Elbette, polisiye romanlar yazmak için tasarlanmış, karakter türlerinin yanı sıra belirli bir dozda zulüm, gizem / şüphe vb. oluşturmaktan henüz çok uzaktır.
Müzik ve dil ile bağlantılı olarak varılan sonuçları göstermek için görsel sanatlardan alınan örnekler kullanılabilir. Tamamen rastgele bir ses titreşimine veya tamamen rastgele bir harf dizisine benzeyen tamamen rastgele bir model, matematiksel açıdan en çarpıcı, en az tahmin edilebilir olanıdır. Tamamen rastgele
Şekil 13.5,
çizim - ne yazık ki, aynı zamanda en sıkıcı olanı; bize göre hepsi aynı görünüyor. Bu, ŞEK. 10.000 rastgele siyah ve beyaz noktanın dağıldığı 13.5 .
Algı sorularıyla uğraşan Bela Gyulesh, elektronik bir bilgisayara rastgele dağılmış noktalardan çizimler yaptırdı; bu, stereoskopik görme ve tanımlama süreci üzerine yaptığı çalışmanın bir parçasıydı. Makine için, bu tür rastgele çizimlerden bazı rastgelelik unsurlarının atıldığı bir program derledi. Bunu, bilgisayarın X harfi biçiminde düzenlenmiş beş noktadan oluşan farklı grupları sırayla incelemesini sağlayarak yaptı (Şekil 13.6'da bu noktalar artılarla, diğer noktalar sıfırlarla işaretlenmiştir). Merkez nokta, 1. ve 4. noktalarla aynı renkteyse (siyah veya beyaz) veya 2 ve 5, sonra rengi değişti (siyah yerine beyaz veya beyaz yerine siyah). Bu, noktaların 1 olduğu durumlar dışında, siyah veya beyaz köşegenlerin görünme olasılığını ortadan kaldırdı. ve 4 beyazdı ve noktalar 2 ve 3 siyah veya tam tersi.
Olarak Şekil l'de görülebilir. 13.7, rastgelelik unsurunu azaltarak modeli değiştirebilir ve onu önemli ölçüde iyileştirebilirsiniz.
OOOOO
1 2
OXOXO
OOXOO
3 4
Oh X o × o
OOOOO
Şekil, 13.6.
Resim. 13.7.
Tahmin edilemezlik (rastgelelik), çeşitlilik veya sürpriz açısından arzu edilir, ancak çizimin çekici görünmesini istiyorsak, bir düzene ihtiyaç vardır.
Düzen ve rastgeleliğin eşzamanlı kullanımının sırrı sanatta uzun zamandır bilinmektedir. Bir kaleydoskoptaki büyüleyici etki, renkli cam parçalarının rastgele düzenlenmesinin birkaç ayna tarafından yansıtılması ve ortaya çıkan desenin altıncı dereceden simetriye sahip olması gerçeğiyle elde edilir.
Yıllar önce, "Merdivenlerden İnen Çıplak" tablosunu yapan Marcel Duchamp, siyah madde parçalarının üzerine birçok ip çizip bunları bir çerçeveye yerleştirmişti. İsviçreli bir sanatçı olan Jean Tingu Li, bir makinenin yardımıyla oldukça iyi sıralı-rastgele çok renkli işler yarattı; bunlardan biri ofisimde asılı duruyor ve ona hayran olmaktan kendimi alamıyorum. Uzun yıllar boyunca bir lehim yastığı sakladım ve onu abanoz bir stand üzerine kurup Modern Sanat Müzesi'ne bağışlamayı planladım. Sonunda hem lehimlemeyi hem de hediye yapma isteğimi kaybettim.
her şey bana bir tür asgari sanat felsefesi verdi ve okuyucuyu temin etmek için acele ediyorum, bunun için enformasyon teorisini suçlamıyorum. Bu, felsefenin asgari düzeyidir, çünkü bir sanat eserinin değerini yalnızca bunlar belirlemesine rağmen, yetenek veya deha hakkında hiçbir şey söylemez.
Sanatta başarı, sadece yazarın yeteneğini değil, aynı zamanda halkın tanınmasını da gerektirir. Ancak işin kendisine ek olarak başka faktörler de halkın görüşünü etkiler. Birisi daha önce bazı işlere karşı ayarlanmışsa, hiçbir şey onu fikrini değiştirmeye zorlayamaz. Ancak önceden belirlenmiş bir şeyi tanıma ve övme arzusu, işe yaramaz bir işe bile hayranlık duymaya neden olabilir. Birincisi, Betty Shannon ve benim bir araya getirdiğimiz marş benzeri besteleri seviyorum. Yazarlar genellikle en kötüsünü değil, kendi eserlerini tercih ederler. Uzun sürmeyen ve görünüşe göre çok az değeri olan modaya uygun şeylere büyük bir grup insanı bile içtenlikle hayran bırakmak mümkündür.
Halk, diğer şeylerin yanı sıra, herhangi bir sanat eserinde yazarın kendi el yazısını, bireyselliğini görmek ister. Yazarın tanınmasını sağlamak için, eseri yeterince tutarlı olmalıdır, aksi halde eseri diğer yazarların eserlerinden ayırt edilemez. Bir resmin ya da müzik parçasının en sevdiğiniz sanatçıya ya da besteciye ait olup olmadığını anlamak için önce plak şirketine bakmanız ya da spikerin anonsunu beklemeniz gerekiyorsa nasıl bir samimi değerlendirmeden bahsedebiliriz?
Şimdi bir an için, farklı üsluplara sahip bir dizi büyük ustanın eseri olduğunu düşündüğümüz tüm şaheserlerin aslında onlardan çok önce tek bir sanatçı tarafından yaratıldığını varsayalım. Bu bizi çok şaşırtabilirdi ama bireysel işlere ne kadar hayran olursak olalım, onu bir sanatçı olarak pek takdir edemedik. İşte Picasso - seçkin bir sanatçı, eserlerini tanımak zor değil ama çok huzursuz. Çeşitli tarzlarda ustalıkla resim yapıyor, ancak yine de tam da bir stilden diğerine bu sonsuz geçişler, birinin eseri hakkında nihai bir yargıya varmasına izin vermiyor. Matisse'i değerlendirmek ne kadar kolay!
Tanınması için, bir sanat eserinin genel halk tarafından anlaşılması gerekir. Çok az Amerikalı çok iyi bir Çin fıkrasına bile gülümseyecek ve on Çin fıkrası bile birden fazla gülümseme uyandırmayacaktır. Bu nedenle, bir sanat eserinin tanınabilmesi için halkın aşina olduğu bir "dilde" yazılmış olması gerekir, aksi takdirde ne kadar çeşitli olursa olsun, halk onu sıkıcı ve monoton bulacaktır. Kaos değil, yalnızca zaten tanıdık olanla zıtlık bizi vurabilir.
Bazı yazarlar, daha önceki ustalar tarafından halka aşılanan "dili" kullanır. Brahms böyle bir bestecidir. Diğerleri, örneğin İzlenimcilerin yaptığı gibi, halka yeni bir dil öğretmeye çalışır. Doğal olarak sanatın dili zamanla değişiyor ve bizim için sanatta yeni “sözler” söyleyenlere minnettar olmalıyız. Ancak Bach ve Handel gibi geçmişin dilini konuşan ama sesinin zirvesinde olan ustaların özgünlüğünden ve özgünlüğünden şüphe duyulmamalıdır.
Sanat için anlaşılır kelimeler ve aralarındaki bağlantılar olan bir dil gerekli olsa da tek başına dil yeterli değildir. Mekanik monotonluk çok sıkıcı ve üzücü bir manzara. Şahsen, Owen Meredith'in mülayim mısralarına rastlantısal düzyazının sürprizlerini tercih ederim. Belki de bir gün sanatta bir bunalım yaşanacağı zaman, insanlık bu kadar yorulan zanaatkârların eserlerinden uzaklaşmak için stokastik sanata yönelmek zorunda kalacak.
Hy , hepsi bilgi teorisi ve sanatıyla ilgili.
On Dördüncü Bölüm
VE YENİDEN
BİLGİ TEORİSİ
Elbette, yeni bir fikrin çok çeşitli sorunları çözmeye katkıda bulunması harikadır. Ama her şeyden önce, buna dikkat çekmek için, yeni bir fikrin açıkça gerekçelendirilmesi ve çok dar bir alan için bile bir değere sahip olması gerekir.
Bu kitapta bilgi kuramının dilbilim, psikoloji ve sanata uygulanmasını araştırdığım için bir bilgi kuramcısı tarafından eleştirildim. Ona göre bilgi teorisi ile bu konular arasındaki ilişki çok zayıf ve hatta şüphelidir. Neden okuyucunun dikkatini bilgi teorisinin bariz bir değer ve öneme sahip olduğu alanlardan uzaklaştırıp hakkında kesin hiçbir şeyin söylenemeyeceği bir konuyu ele almamız gerektiğini soruyor.
Bu kitabı yazarken, bir yandan, okuyucuya katı ve dar anlamıyla enformasyon teorisi ile diğer eserlerin yazarları tarafından birçok kez ilişkilendirildiği çeşitli alanlar arasındaki bağlantıyı anlatmak zorunda hissettim. Öte yandan, bilgi teorisi bilgisinin dilbilim, sanat ve psikolojinin bazı sorunları hakkında yetkin bir şekilde konuşmamıza veya en kötü ihtimalle bizi saçma sapan açıklamalar yapmaktan alıkoyacağına inanıyorum. Ancak, bilgi teorisi üzerine bir kitapta bu tür konuların ele alınması da dahil olmak üzere, ne zaman duracağınızı bilmeniz gerekir.
Enformasyon teorisinin esas olarak* dil, sibernetik, psikoloji ve sanat gibi çeşitli alanlarla geniş bağlantıları nedeniyle değerli olduğunu iddia etmek veya varsaymak elbette yanlış olur. Böyle düşünmek, diğer önemli keşiflerle ilgili olarak yapılan hataları tekrarlamak demektir.
Böylece, Newton'un hayatı boyunca, çalışmaları tartışmalar ve felsefi muhakeme ile karartıldı ve bu nedenle, ondan sonraki uzun yıllar boyunca, insanların zihninde, yalnızca gerçek özünü gölgeleyen hayali bir evrensellikle ilişkilendirildi. Einstein olaylara daha ölçülü bakabiliyordu. "Akıl, sürekli olarak önüne koyduğu görevlere kıyasla elbette zayıftır" dedi. Einstein, Newton'un bilime katkılarından bahsederken şöyle diyor: "... ve yine de hedefe ulaşıldı, gök mekaniği bilimi yaratıldı, bizzat Newton ve ondan sonra gelenler tarafından binlerce kez * doğrulandı."
Adil olmak gerekirse, Newton'un zamanından beri mekanik, ne Newton'un ne de çağdaşlarının şüphelenmediği sorunları çözmek veya çözmenin yollarını bulmak için başarıyla kullanıldı, ancak bazı iyimser filozofların yaptığı gibi bilimin tüm sorunlarını çözmedi. ile.
Bence bilgi teorisinin şüphesiz değeri tam olarak nedir, açıktır. Bilgi yaratma hızı veya ergodik bir sistemin entropisi kavramlarını kapsar.
kaynağının korosu , gürültülü kanalın ve sissiz kanalın iş hacminin yanı sıra, kaynak tarafından üretilen mesajların verimli bir şekilde kodlanması, mesajların kanal verimine yakın bir oranda neredeyse hatasız iletilmesini sağlar. Bilgi teorisi sayesinde anladığımız ve onun sayesinde aşikar bir değere sahip olan dünya, telekomünikasyon sistemleri dünyasıdır, esas olarak bu tür sistemlerin derin, makul inşası ve hesaplanması dünyasıdır.
Kitabın sonunda, bilgi teorisinin geniş teorik olasılıkları (veya imkansızlıkları?) ve bilgi teorisi uzmanları tarafından matematiksel bakış açısıyla iyi temellendirilmiş, doğru, mantıklı olacak şekilde ne yapılıyor? Başka bir deyişle, uzun süre tartışabileceğimiz tartışmalarla ilgilenmiyoruz, uzmanlar tarafından yapılan ne tür işleri ciddi bilim olarak kabul etmemiz gerektiğini bilmemiz gerekiyor.
Burada çok çeşitli ■işler buluyoruz. Okuyuculara tüm bu çalışmaları tam olarak anlatmak için başka bir kitap daha gerekir. Bu nedenle, kendimi Shannon'ın ufuk açıcı makalesinin yayınlanmasından bu yana yayınlanan enformasyon kuramı üzerine çalışmaların yalnızca bazılarını kısaca yeniden anlatmakla sınırlayacağım. Bu bölümün amacı, okuyucuyu dar anlamda bilgi teorisiyle tanıştırmak ve mümkünse onu baştan çıkarmaktır. bu teoriyi daha derinlemesine araştırın.
Bazı bilgi teorisyenleri, bir mesaj kaynağı tarafından bilginin yaratılma hızını karakterize eden entropi kavramını, bilgiyi kodlama ve iletme problemlerinden biraz farklı problemleri çözmek için uygulamaya çalıştılar. Daha hırslı olanlar bu kavrama bağımsız bir anlam vermek isterken, daha alçakgönüllüler, anlamlı ve doğru olması koşuluyla herhangi bir entropi uygulaması için daha da azını kabul etmeye hazırdı.
Şimdiye kadar, verimli kodlama sorunu dışındaki bir sorunu çözmek için bu kriterleri karşılayan tek bilgi üretim hızı uygulaması 1956'da bulundu .
J. Kelly*. Bu konsepti, oyunculardan birinin (veya tartışanların) anlaşmazlığın konusu olan rastgele bir olayın sonucu hakkında gizlice bilgi aldığı rastgele oyunların incelenmesine uyguladı . Örneğin, bir zarın çoktan atıldığını (veya yarışların çoktan sona erdiğini) ve tartışmacılar arasında tercih edilenin bunu bildiğini ve atışın (veya yarışların) sonucu hakkında da bir şeyler bildiğini düşünelim. ve tartıştığı kişi hiçbir şey bilmiyor ve dürüstçe oyununu belirli bir sonucun olasılığına dayandırıyor.
Varsayalım ki ilk oyuncu bit şeklinde, yani evet-hayır cevapları şeklinde bilgi alıyor. Örneğin ipucu, ilk oyuncuya bir bitlik bilgi göndererek madeni paranın tura mı yoksa yazı mı geldiği konusunda tam olarak bilgi verebilir. Veya, aynı bilgi bitinin yardımıyla, hinter birinci oyuncu için zar atışının olası sonuçlarının sayısını 6'dan 3'e indirebilir ve ona atılan sayının çift mi yoksa tek mi olduğunu söyleyebilir.
Bu girişi yaptıktan sonra, kitabından şu pasajı alıntılayarak sonucu açıklamayı Kelly'nin kendisine bırakacağım:
"İletişim kanalının girişindeki semboller, üzerine bahis yapılan rastgele bir olayın sonuçlarını temsil ediyorsa ve avantaj, sonuçların olasılıklarıyla tutarlıysa (yani, "adil" avantaj), o zaman bu sembolleri kabul eden oyuncular, bu bilgiyi sermayesinin katlanarak büyümesi için kullanabilirler. Bu oyuncunun sermayesinin maksimum üstel büyüme oranı, bu kanal aracılığıyla maksimum bilgi aktarım hızına eşittir. Bu sonuç, keyfi bir avantaj durumuna genelleştirilebilir.”
burada herhangi bir kodlama kastedilmese de maksimum bilgi aktarım hızı kavramının önemli olduğu bir durum bulduk . Önceden, bu kavramın önemi yalnızca, uygun kodlama yöntemlerinin yardımıyla ikili basamakları belirli bir kanal üzerinden bu hızda ve keyfi olarak küçük bir hata olasılığıyla iletmenin mümkün olacağını belirten Shannon teoremi tarafından önceden belirlenmişti.
N'den sonra oyunlar (bahisler), ilk oyuncunun başlangıç sermayesi aşağıdaki sayıda artacaktır: 2≡,
* Bilgi Hızının Yeni Yorumu , Bell Sistemi Teknik Dergisi, 35, 917 (1956).
burada R , her bahis (her oyun) sırasında ilk oyuncuya iletilen ortalama bilgi biti sayısıdır .
Bu, bit cinsinden ifade edilen bilgi miktarının kullanımına ilişkin çok basit bir örnek gibi görünüyorsa, okuyucuya bunun, bilgi miktarının hızıyla ilgili olmayan matematiksel olarak tek sağlam yorumu olduğunu düşünmesini tavsiye ederim . en olası mesajların oluşturulması ve bu mesajların iletilmesi için verimli bir şekilde kodlanması.
Bilgi teorisini ilerletmek için, bilgi yaratma hızına ilişkin yeni yorumlar yerine belki de yeni uygulamalar aranmalıdır. Böylece, 1949'da K. Shannon, "Gizli Sistemlerde Bilgi Teorisi" ♦ başlıklı uzun bir makale yayınladı. Bu makalenin mesajların şifresini çözmede çok yardımcı olacağı şüphelidir, ancak öte yandan, şifreleme uzmanları tarafından büyük beğeni toplayan şifreleme (kriptografi) ve şifre çözme (kriptanaliz) teorisini sunan ilk makaleydi.
Shannon'ın çalışmasının ayrıntılarına bir bölümde girmeye çalışmak umutsuz ama okuyuculara içeriği hakkında biraz fikir vermeye çalışacağım.
Kendisinin bilmediği bir şekilde şifrelenmiş bir mesajı yakalayan bir kriptograf iki şeyi bilmez: yakalanan mesajın içeriği ve onu şifrelemek için kullanılan yöntem, sözde anahtar.
Bazı durumlarda, şifreleyici, genel şifreleme şeması hakkında biraz bilgiye sahip olabilir. Gülünç derecede basit bir örneği ele alalım ve şifrelemede basit bir ikame şifresinin kullanıldığını, yani bir şemaya göre alfabenin her harfinin başka bir harfle değiştirildiğini bildiğini varsayalım.
Şifresi çözülecek mesaj kısa veya uzun olabilir. Mesaj sadece üç harf içeriyorsa, örneğin QXD, o zaman bunlar VE kelimesinin veya BET kelimesinin veya üç farklı harften oluşan herhangi bir İngilizce kelimenin yerini alabilir . Ancak mesaj uzadıkça, basit bir ikame şifresiyle şifrelenen ve o mesajı verebilecek olası İngilizce metinlerin sayısı azalır; şifrelenmişse
* Bell Sistemi Teknik Dergisi, 28, 656 (1949).
Resim. 14.1.
mesaj yeterince uzunsa, o kaynaktan yalnızca bir olası mesaj gelir.
Shannon, incelenmekte olan şifreli mesajı hangi metnin verebileceği konusundaki belirsizlikteki bu azalmayı, güvenilmezlikteki bir değişiklikle ifade etti. Güvenilmezlik H y (x), Bölüm 8'de ele alındığında, hangi metnin, olağan yöntemlerden biriyle şifrelenirse, ele geçirilmiş şifreli bir mesaj üreteceği konusunda bir belirsizlik vardır. Shannon, çeşitli şifreler için mesajdaki karakter sayısındaki artışla güvenilmezlikteki azalmayı hesaplayabildi. Güvenilmezlik sıfıra yaklaştığında, şifrelenmiş bir mesajın yalnızca bir "çözüm"ü olabilir ve bu mesajın şifresi prensip olarak benzersiz bir şekilde çözülebilir.
hangi sorunlarla karşılaştı veya karşılaşıyor? Bu problemlerden bazıları örnekleme teoremi ile ilgilidir. Bilgi teorisyenleri, düzgün bir şekilde değişen, bantla sınırlı bir sinyali, örnekler adı verilen bir sayı dizisine eşlemek için örnekleme teoremini kullanır; örnekler, W'nin sinyal bant genişliği olduğu her 1 /2W saniyede bir sinyal değerleridir.
Belirli bir bant sınırlı sinyali temsil eden numuneler, farklı zaman noktalarında olduğu gibi çeşitli şekillerde alınabilir. Yani, Şek. 14.1 dikey kesintisiz ve kesikli çizgiler, bu işlevi doğru şekilde temsil eden okumalardır; okumalar başka birçok noktada da alınabilir. Ayrıca, 1 saniye boyunca alınan ortalama okuma sayısı 2WI'ye eşit olması koşuluyla, düzenli aralıklarla okuma yapılmasına bile gerek yoktur.
Kesin olarak görüntülenen bant sınırlı sinyal 2W süresiz olarak alınan numunelerden alınacak numunelere kadar sadece tüm numuneler kullanılıyorsa saniyede numuneler
sonsuz uzak gelecekte. Sıklıkla bir bant-sınırlı sinyal parçasından veya herhangi bir zamanda, belirli bir zaman aralığı dışında sıfıra yakın olan bir bant-sınırlı sinyalden bahsetmemiz gerekir ve böyle bir parçayı tanımlayabilmek isteriz. numune sinyali veya sınırlı süreli sinyal aracılığıyla sıkıştırılmış bir biçimde.
Akla gelen ilk soru şudur: Önceki ve sonraki örnekler hakkında hiçbir şey söylemeden, sadece sonlu sayıda örneğin değerlerini belirleyerek kısa bir sinyali veya bir sinyal parçasını gösterebilir miyiz? Ne yazık ki, bu kadar sınırlı bir örnek dizisi yalnızca bant genişliği sınırlı sinyalimizi yansıtmaz; birçok farklı bant sınırlı sinyal, sonlu bir örnek dizisinden geçebilir ve örnekleme aralığının dışındaki bu sinyaller çok büyükse, bu aralık içinde büyük ölçüde farklılık gösterebilirler.
Numunelerin belirli ardışık değerleri belirlenirse ve önceki ve sonraki tüm numuneler sıfıra eşitlenirse bu eksikliğin giderileceği varsayılabilir. Doğal olarak, bu şekilde tanımlanan bant sınırlı sinyalin, değerlerin sıfır olmadığı örnek değerlerle iyi uyum sağlayacağını ve örnek değerlerin sıfır olduğu her yerde bu sinyalin sıfıra yakın olacağını varsayıyoruz.
t Q anından başlayarak düzenli aralıklarla alınan tüm numunelerin değerleri sıfıra eşit olsun ve t Q zamanına kadar numunelerin değerleri sıfıra eşit olmasın ( ile gösterilir ) Şekil 14.2'deki noktalar). Örneklerin değerleri hem geçmişte hem de günümüzde tüm zamanlar için tanımlandığından, gerçekten tek bir bant sınırlı sinyali tanımlarlar. Bu sinyal t 0 t'den başlayarak herhangi bir zamanda sıfıra yakın olacak mı ?
Ne yazık ki Bell Telephone Laboratories'den H. Pollak bunun gerekli olmadığını kanıtladı. Örneğin şu soruyu soralım: Bu örneklerden geçen bant sınırlayıcı sinyalin toplam enerjisinin ne kadarı t 0 anından itibaren zaman aralığına düşer? 10 saniye sonra gelecek olan ana kadar ,
t -* ~ t0
Resim. 14.2.
veya 20 dakika veya 50 yıl sonra? Burada f'ye t 0 anından başlayarak tüm okumaların , sıfıra eşittir.
Cevap beklenmedik: Okumaları hangi andan itibaren sıfıra eşitlersek ayarlayalım, sinyalin bu noktadan başlayan kısmının enerjisi, toplam sinyal enerjisinin neredeyse yarısı olabilir. Böylece, t 0 anından itibaren sinyal, tüm referans noktalarında sıfıra eşit olabilir ve aralarında yeterince büyük olabilir.
Sınırlı uzunluktaki sinyalleri doğru bir şekilde temsil etmek için örnekleme teoremini kullanma girişimleri matematiksel bir çıkmaza girdi ve matematikçiler bir çıkış yolu bulmak için ellerinden gelenin en iyisini yapmaya çalışıyorlar.
Pollack ve Slepian'ın çalışması, ne örneklerin ne de sinüzoidlerin sonlu süreli bant genişliği sınırlı işlevleri görüntülemek için uygun olmadığını gösterir; bu amaçlar için daha uygun olan, eliptik adı verilen bir grup fonksiyon kullandılar .
Bilgi teorisyenlerinin kafasını karıştıran bir diğer konu da bu örnekle açıklanabilir. Telgraf sinyallemesinde, pozitif bir darbenin bir noktayı ve negatif bir darbenin bir çizgiyi temsil ettiğini varsayalım. Ayrıca, bir şakacının kabloları ters sırada bağladığını ve pozitif bir darbe iletildiğinde negatif bir darbe alındığını ve negatif bir darbe iletildiğinde pozitif bir darbe alındığını varsayalım. Belirsizlik getirilmediğinden, bilgi teorisine göre bilgi aktarım hızı aynı kaldı. Yine de iletişim sisteminin normal işleyişinin bozulduğunu ve sistemin zarar gördüğünü hissediyoruz. Benzer bir yenilik, bir teleprinter hattında daha da tehlikelidir, tele daktilo sürekli olarak W harfi yerine A'yı , K harfi yerine B'yi vb. yazdırabilir.
Bütün bunlar Shannon'a musallat oldu ve yukarıdaki durumu hesaba katan bir teori geliştirdi. Bu teoride Shannon, bir doğruluk kriteri kavramını ortaya koymaktadır. Bu nedenle, bir ünlünün yerine bir ünsüzün geçmesine belirli bir bozulma ölçüsü ve bir ünlünün diğerinin yerine biraz daha küçük bir bozulma ölçüsü atfedilirse, o zaman bu teorinin yardımıyla dereceyi tahmin etmek mümkündür. hem sabit hem de rastgele müdahale varlığında tüm mesajın bozulması. Shannon, gürültülü bir kanal üzerinden iletim sırasında rastgele hataların bir sonucu olarak meydana gelen distorsiyonun nasıl en aza indirileceğini gösterdi ve belirli bir doğruluk kriteri ile bir sinyali iletmek için saniyede kaç bit gerektiğini gösterdi.
Shannon, mesajların, bir mesajın diğeriyle çakışabileceği ve alımı engelleyebileceği kanallar aracılığıyla iletilmesiyle bağlantılı olarak da önemli çalışmalar yaptı. En basit durum, mesajların 4 ve B noktaları arasında aynı kanal üzerinden iki yönlü iletimidir. Basitlik için, kanalın özelliklerinin iletim yönüne, yani mesajın B'den iletilip iletilmediğine bağlı olmadığını varsayıyoruz . A'ya veya A'dan V'ye . _
Şekil l'de gösterildiği gibi çizin. 14.3, B'den A'ya iletim yaparken kanalın bant genişliğine bağlı olarak A'dan B'ye iletim yaparken kanalın bant genişliğinin bir grafiği . En basit iki durumu ele alalım. İlk durumda, S'den 4'e geçiş A'dan B'ye geçişe müdahale etmez ve A'dan B'ye geçiş B'den A'ya geçişe müdahale etmez . Bu durumda gereken eğri yatay bir eğriden oluşur . B'den A'ya kanal kapasitesini belirleyen düz çizgi ve A'dan B'ye kanalın bant genişliğini tanımlayan dikey bir düz çizgi .
İkinci durum - zamanın her anında yalnızca bir yönde - A'dan B'ye veya B'den A'ya - iletmek mümkündür . kanal, o zaman B'den A'ya toplam çalışma süresinin üçte ikisi boyunca iletim yapmak mümkündür, vb. B'den A'ya bant genişliğinin ve A'dan B'ye bant genişliğinin toplamı sabit olması gerektiğinden, ŞEK. 14.3
Resim. 14.3.
bu durum 45° açıyla çizilmiş kesikli bir düz çizgi ile gösterilmiştir .
Her iki yönde iletim arasında bir miktar girişimin olduğu ara durumda, Şekil 2'de gösterilen eğriyi elde edeceğiz. 14.3 kısa vuruşlarla.
Bilgi teorisindeki uzmanların ilgisi, verimli kodlama konularını çekmeye devam ediyor. Teorisyenler sürekli olarak, ayrı bir kanal üzerinden bir dizi B rakamını iletirken A hatalarını düzelten en verimli kodun peşindeler ve sürekli olarak en iyi kodları bulmak için sistematik bir yol arıyorlar, ancak şimdiye kadar bunu başaramadılar. yapmak için.
Bilgi teorisyenleri ayrıca, gürültülü sürekli bir kanal üzerinden bilgi iletmek için en iyi kodları bulmaya çalışıyorlar. 1959'da Shannon, Gauss gürültüsü ile sürekli bir kanal üzerinden sinyallerin iletilmesinde kullanılan değişken karmaşıklığa (yani uzunluk) sahip kodlar için hata olasılığının üst ve alt sınırlarını belirlediği uzun bir makale yayınladı.
Ek olarak, elektrik iletişimini geliştirmek isteyen mühendisler, sürekli olarak kullanımı yeterince basit olan yeni kodlama ve verici devreleri bulmaya çalışıyorlar. Özellikle, televizyon ve ses sinyallerini saniyede mümkün olduğunca az sayıda ikili basamakla kodlamaya çalışırlar; bunu yapmak için kullandıkları yöntemler Bölüm 7'de tartışılmaktadır . Dijital sinyalleme (örneğin PCM) daha yaygın hale geldikçe, bu tür verimli kodlamanın önemi artacaktır. Güvenlik en iyi dijital olarak sağlandığından, güvenlik amacıyla sinyallerin şifrelenmesi daha yaygın hale geldikçe önemi de artacaktır.
Mühendisler, mevcut telefon kanalları üzerinden sinyal gönderirken ortaya çıkan sayısız hatayı düzeltecek daha basit ama etkili bir kod arıyorlar. Sayılar, hem askeri hem de sivil alanda metin ve iş ve teknik verilerin iletiminde giderek daha fazla kullanılmaktadır. Telefon kabloları neredeyse her yere nüfuz etti. Yeterince düşük bir hata olasılığı ile mevcut telefon devreleri üzerinden iletilebilmeleri için bunları kodlamanın bir yolu olsaydı, birçok iletişim olasılığı çok daha hızlı uygulanabilirdi.
9 ve 10'da belirtildiği gibi mühendisler , sinyallerin düşük verici gücüyle uzun mesafelerde iletilmesine izin verecek AM ve FM'den daha verimli modülasyon yöntemleri arıyorlar . Kıtalar arasında televizyon ve telefon mesajlarını iletmek için uydular kullanıldığında, genlik modülasyonundan yaklaşık yüz kat daha az güç gerektiren geniş bant modülasyonu yöntemlerinden biri olacağı neredeyse kesindir. Böylece bir uydu üzerine kurulu 2 Wtp'lik bir verici Amerika'dan Londra veya Paris'e bir televizyon sinyalinin iletilmesini sağlayacaktır.
Okuyucuya, bilgi kuramının bize açtığı geniş ufuklarla karşılaştırıldığında bu sorular çok küçük ve ilham verici gelmeyebilir. Fransız İzlenimcilerin ya da Hollandalı üslup resim ustalarının yapıtlarıyla dolu olan derin ve sevgi dolu doğa anlayışı, diyelim ki Japonlar, yeni ve yabancı bir sanat dünyasıyla baş döndürücü bir karşılaşma kadar aynı etkiyi yaratabilir mi? Ancak konusunu sevgiyle inceleyen bir sanat eleştirmeni, hevesli bir amatör kadar hayranlık duyabilir. Alanınızı gerçekte olduğu gibi görmeli ve takdir etmelisiniz ve onu deneyimsizlerin zihninde yarattığı şeye göre yargılamamalısınız. Bana öyle geliyor ki kitabımın ilginç noktaları var ve umarım okuyucuyu bu alanda çalışan araştırmacıların sahip olduğu bilgi teorisi açısından çok uzağa götürmemişimdir.
Biraz sakinleştirici duygular, belki de bitirebilirsin.
Başvuru
MATEMATİK HAKKINDA
NOTASYON
Bu kitapta okuyucu oldukça fazla sayıda farklı matematiksel gösterim ve formül bulacaktır. Bu belki de ona bu kitabın matematiksel olduğunu söyletecek.
Tabiki öyle. Sonuçta bilgi kuramı matematiksel bir kuramdır ve bu kitap da matematiksel bir iletişim kuramı olduğundan, matematiksel ifadeler kaçınılmazdır. Ancak, kullandığımız matematiksel semboller okuyucunun gözünü korkutmasın. Kitabımız tam olarak şu anda olduğu kadar matematik içerebilir ve aynı zamanda tek bir sembol veya eşittir işareti olmayabilir.
Eski Babilliler ve Hindular, bazı cebirsel olanlar da dahil olmak üzere birçok matematiksel işlemi kelimeler ve deyimlerle gerçekleştirebiliyorlardı. Matematiksel gösterim çok sonra ortaya çıktı. Matematiksel hesaplamaları basitleştirmek için tanıtıldılar ve bu, onlara aşina olanlar için geçerlidir. Matematiksel semboller, normalde sürekli olarak tekrarlanması gereken uzun ifadelerin yerini alan basit simgelerdir. Bu durumda, dikkate alınan her değer uygun bir kısa "ad" alır. Matematiksel notasyon, matematiksel ilişkileri daha özlü ve açıklayıcı hale getirir, böylece aksi takdirde tümce (veya tümceler) boyunca dağılacak olan nicelikler arasındaki ilişkiyi bir bakışta yakalamak mümkün olur, böylece tüm ilişkiyi kendi içinde yakalamak zor olur. bütünlük
Matematiksel gösterim, matematiksel ifadeleri yazmanın uygun bir yoludur, tıpkı müzik notalarının notalarla yazılması gibi. Matematiksel işaretlerin yardımıyla biraz yazabilirsiniz, ancak harf veya notların yardımıyla. Matematiksel notasyonlarla dolu ama içinde zerre kadar matematik olmayan eserler yazan grafomaniler var.
Bu kitapta, en önemli fikirleri kelimelere dökmeye çalıştım. Ancak matematiksel işaretlerin yardımıyla kısaca yazılanları anlamak çok daha kolay ve basit olduğundan, çok sayıda durumda matematiksel gösterim biçimini kullandım. Sunum sırasında birçok matematiksel gösterimi açıkladım ama bunlar kitap boyunca dağılmış durumda, bu yüzden onları tek bir yerde bir araya getirmeye ve aynı zamanda onlar hakkında daha ayrıntılı konuşmaya karar verdim. Okuyucu için yararlı ve ilginç olacakları umuduyla, bu kitapta kullanılmayan birkaç basit ilgili soruyu ve notasyonu burada ele almaya cesaret ettim.
Her şeyden önce, diğer kavramların yanı sıra sayıların da harflerle gösterilebileceğini belirtmek isterim. Yani, 5. bölümden Bj'ye kadar alfabedeki harfler gibi sembollerin veya karakterlerin bir grubunu veya sırasını belirtir; j harfi hangi grubun kastedildiğini belirleyin . İlk harf grubu için j bire eşit olabilir ve bu ilk grubun kendisi örneğin AAA olabilir . Başka bir / değeri için, örneğin 121, bu grup ZQE olabilir .
Sayıları toplama, çıkarma, çarpma ve bölme işlemlerine sık sık ihtiyaç duyarız. Bu durumda, bazen sayıların yerini harfler alır. İşte bu işlemlerin matematiksel gösterimine örnekler:
Ek
2 + 3
bir + d
a + d kaydını okuyoruz "a artı d" gibi. a + d ifadesiyle, a harfi ile gösterilen sayı ile d harfi ile gösterilen sayının toplamını kastediyoruz :
Вычитание
5-4
gr
q - r'yi q eksi r olarak okuruz .
Çarpma işlemi
3×5 veya 3-5 veya (3) (5)
r;, veya ve •v veya iv.
3 ve 5 rakamlarını ayıran parantez olmasaydı bu iki sayı 35 (otuzbeş) olarak alınabilirdi . Çarpmak istediğimiz herhangi bir değeri ayırmak için parantez kullanabiliriz. Uv'yi (u)(r;) olarak yazabiliriz , ancak bu gerekli değildir. (3)(5)'i 3 çarpı 5 olarak okuyoruz ama u; “u çarpı r;” değil, ve ve r; arasında duraklama olmadan “ig;”.
θ fi∕
у , или β∕3
или 1/р.
Bölüm
6 : 3 veya p'
Biz genellikle Hp okuruz. yani: "bir bölü p" değil, "bir bölü p".
Parantez içindeki değerler tek bir sayı olarak ele alınır, örneğin:
6 ״ ( 4 ÷ 2 )
3 3 gün
(4+ 8) (2) =(12) (2) = 24
(a-[-b)c = ac- ∖ -bc
+ b)' yi ya "a artı b" ya da " a artı b'nin toplamı >> 1 " şeklinde okuruz. ilk yol kafa karıştırıcı olabilirse. Yani, "c çarpı a artı 6" dersek , bu ca anlamına gelebilir. + ⅛, ancak bu durumda "ca artı b" demek daha doğru olur . "c çarpı a artı 6'nın toplamı" dersek , o zaman c(a + b) ile ne demek istediğimiz anlaşılır .
Tablo 16
Bu kitapta, olasılık kavramı sıklıkla kullanılmıştır. Örneğin, bazı karakter dizilerinde /inci karakterin olma olasılığının p (/) olduğunu söyleyebiliriz . "/'den p" okur.
Semboller kelimeler, sayılar veya harfler olabilir. Bir tablodaki karakterleri özetleyebilirsiniz; bu nedenle /'nin farklı anlamları, karşılık gelen sembollere atanan farklı sayılar olarak anlaşılabilir. Sayılar arasında böyle bir yazışma kurmanın bir yolu / ve alfabenin harfleri gösterilmektedir. sekme. 16.
Herhangi bir harfin olma olasılığını yazmak istersek, örneğin N i sonra bu tabloyu kullanarak p(5) yazarız, çünkü N harfi tablomuzda 5 rakamına karşılık gelir . Ancak genellikle p(N) şeklinde basitçe yazılır .
Bir harfin çıkma olasılığı nedir? Belirli bir harfin uzun bir örneklemde kaç kez geçtiğini ifade eden sayının, örneklemdeki toplam harf sayısına oranıdır. Yani, bir milyon harften 130.000'i E olacak, yani
מ (Yu - *θθ θθθ _ l l Q
p w~ 1000000 “ u,1 θ ,
Bazen iki olayın birbiri ardına veya aynı anda meydana gelme olasılığından bahsederiz. Örneğin, iletilen i harfini ve alınan y harfini gösterelim . x harfinin iletilmesi ve y'nin alınması olasılığı p (i, y) olarak yazılacaktır . Bu ifade " x i'den p" olarak okunur. y ” (“virgül” kelimesi telaffuz edilmez, bunun yerine bir duraklama yapılır). Diyelim ki, W harfi iletiliyor ve B harfi alınıyor Belirli bir sonucun olasılığı p(W, B) şeklinde yazılabilir . Diğer sonuçların olasılıkları p (A, A), p olarak yazılabilir. (S, S), s (E, E), vb. p(x, y) ile bu sonuçlardan herhangi biri.
Koşullu olasılıklar da vardır . Diyelim ki x harfini geçiyorum . y harfinin gelme olasılığı kaçtır ? Bu koşullu olasılık, p x (y) olarak yazılır . Şöyle yazıyor: " y'den x işaretiyle p ." Birçok yazar böyle bir koşullu olasılık p(y | n) yazar ; bu "x ile y'nin olasılığı" olarak okunabilir . Shannon'ın iletişimin matematiksel teorisi üzerine ufuk açıcı makalesinde kullandığı notasyonun aynısını kullandım.
Şimdi basit bir matematiksel bağıntıyı yazıp yorumlamaya çalışalım.
P (* " Y) \u003d PW Px ( y) •
x ve vj'nin birlikte olma olasılığı, x'in ortaya çıktığı biliniyorsa , i'nin olma olasılığının y'nin olma olasılığıyla çarpımına eşittir .
Sıklıkla birçok sayıyı, olasılığı ve benzerlerini toplamamız gerekir; bu eylemi Yunanca 2 harfi (sigma) ile gösteriyoruz . y bir tamsayı olsun, yani e. ן 0, 1, 2, 3, 4, 5 vb. olabilir . Diyelim ki yazmak istiyoruz.
0-flf-2-f-3-f-4-}~5-}-6- ∣ -7 ־־ b 8j
toplamda bu 36'dır. Şöyle yazılır: j=8
ben=0
ן toplamı” şeklinde okunur. genel olarak / ן' den 0'a / eşittir 8" . W işareti ! toplamı ifade eder. Toplam işaretinin altına yazılan / == O, toplamanın 0'dan başlaması gerektiği anlamına gelir ve işaretin üzerine yazılan / = 8 , 8 sayısında durmanız gerektiği anlamına gelir. Toplam işaretinin sağına yazılan / harfi şu anlama gelir: bu durumda tamsayıları toplamanız gerekir.
J'nin bir sıra sayısından fazla olmadığı nicelikler vardır . Örneğin, Tabloda sunulan çeşitli harflerin ortaya çıkma olasılıkları bunlardır. 17.
Tablo 17
Bu olasılıkları alfabenin tüm harfleri üzerinden toplamak isteseydik, bu toplam aşağıdaki gibi yazılırdı:
26
Σ P (7) י
J=ben
ן üzerindeki p (/) toplamı 1 ila 26" arası . Bu toplamın değeri doğal olarak 1'e eşittir. E harfi (/ - 1) için p değeri (1) bu harfin ne sıklıkta geçtiğini gösteren göreli bir sayı vardır, T harfi için (/ = 2) aynı şey j p(2) değeri için de geçerlidir , vb.; yani j numaralı alfabenin her harfinin j p(7) değerleri yeterince büyük bir metinde genel olarak karşılık gelen harfin görülme sıklığını karakterize eder.
eğer sadece yazarsan
∑P(7),
3
o zaman bu, /'nin tüm olası değerlerinin toplamı, yani en azından bir şey ifade eden tüm y'lerin toplamı anlamına gelir. Bu, " p (j) toplamı" olarak okunabilir. senin tarafından". Eğer j alfabenin bir harfiyse , bu ifade, yirmi altı farklı olasılığı eklemeniz veya başka bir deyişle toplamanız gerektiği anlamına gelir.
і ve / gibi iki harf içeren ifadelerle karşılaşırız . Bu ifadeleri indekslerden biri üzerinden toplamamız gerektiğini varsayalım . p(i, /), / harfinin i harfinden sonra gelme olasılığı olsun, yani / ? (Q,V)ectτb, QV dizisinin oluşma olasılığıdır . Toplamı şu şekilde yazıyoruz:
∑P(i> І) •
i'den p'nin toplamı , ן İle /". Başka bir deyişle, /'nin tüm olası değerlerini değiştirmeniz ve olasılıkları eklemeniz gerekir. Dikkat
∑P(j.7) = P(0∙
3
Bunu şöyle okuyalım: " j'den p'nin toplamı , j by /, r'den p'ye eşittir". Olası harflerden birinin bir harften sonra gelme olasılığını toplarsak, o zaman ilk harfin görünme olasılığını elde ederiz, çünkü bu harfin ardından her zaman bir harf gelir .
Toplama, çıkarma, çarpma ve bölme işlemlerine ek olarak, herhangi bir sayının belirli sayıda çarpmasını kendi başına gösterebilmeliyiz. Bu, çarpılan sayının sağ üst köşesine kaç kez çarpmanız gerektiğini gösteren bir rakam atayarak yapılabilir; Bu rakama üs denir :
2 1 = 2
"2 üzeri bir (veya 2 üzeri bir) 2'ye eşittir"; üs 1'dir;
2 2 = 4
"2'nin karesi (veya 2'nin karesi) eşittir 4"; üs 2;
2 3 = 8
"2'nin küpü (veya 2'nin küpü) eşittir 8"; üs 3;
2 4 = 16
"Dördüncüde 2 eşittir 16"; üs 4.
Üs bir harf olabilir, örneğin ve; "2 üzeri 7" şeklinde okunan 2 n ifadesi , ⅛ 2'yi n defa kendisiyle çarpmanız gerektiği anlamına gelir . “a'nın n'inci kuvveti” olarak okunan a p ifadesi , a'nın kendisi ile n kez çarpılması gerektiği anlamına gelir .
Mantıksal sonuçlar elde etmek için, koymak gerekir
bir 0 = 1 _
j "a'nın sıfırıncı kuvveti bire eşittir", a sayısı ne olursa olsun.
Matematikte kesirli ve negatif üslere de izin verilir. Özellikle,
veya IMn._ _ _
ifade a~ n "ve eksi 7. kuvvet" şeklinde okunur.
Şuna da dikkat edin
bir n bir t = bir {n+t)
"a üzeri n'inci güç ile a üzeri m'inci güç çarpı ן a üzeri n artı 7p'ye eşittir." Bu yüzden,
2 3 × 2 2 = 8 × 4 = 32 = 2 δ veya
4 1/2 × 4 lχ2 = 4 1 = 4.
1/2'nin kuvvetine yükseltilmiş bir sayı , o sayının kareköküdür .
4 1/2 = 4'ün karekökü = 2.
10'un kuvveti veya başka bir sayı kullanılarak yazılır:
3.5 X IO6 = 3.500.000 .
Şöyle yazıyor: "Hamurda onda üç ve beş çarpı on."
Bu kitapta logaritmik fonksiyon da yaygın olarak kullanılmıştır. Logaritmalar çeşitli temellere dayalı olabilir . Bölüm 12'de özel olarak belirtilmediği sürece , bu kitaptaki tüm logaritmaların tabanı 2'dir.
2 tabanı logaritması , verilen sayıyı elde etmek için tabanın yükseltilmesi gereken kuvvettir. Bir x sayısının 2 tabanına göre logaritması Iog x kitabında yazılmıştır. ve "logaritma x"i okuyun. 2 tabanlı logaritmanın verilen tanımı şu şekilde de yazılabilir:
2 10δx ≈x,
yani "2 üzeri log x eşittir x". Örneğin,
günlük 8 = 3,
2 3 = 8.
Ve burada 2 tabanındaki diğer sayıların logaritmaları :
Logaritmaların bazı önemli özelliklerine dikkat edilmelidir:
kütük ab = kütük bir + Iog &, Iog- = Ioga-10gδ, Iog d c = c günlük d.
Son ilişkinin özel bir durumu olarak,
Iog 2 m = 7p Iog 2 = 7p.
2 tabanlı logaritmalar yalnızca bilgi teorisinde kullanılır. Genel bir kural olarak, 10 tabanına veya e tabanına göre logaritmalar yaygın olarak kullanılır (e yaklaşık 2,718'dir). Tabanları logaritmanın işaretine yazarsak, şunu not etmekte fayda var:
günlük 2 X = (Günlük 2 10) (Günlük 10 x) = }° ∣ 1 1 θ* ,
günlük 2 x = 3.32 günlük 10 X,
günlük 2 X = (Günlük 2 f) (log e X) = -j3 ∣ Mj- = ⅛ , günlük 2 X = 1,4410g β X = 1.44 s.
E tabanına göre logaritma, doğal logaritma olarak adlandırılır ve x ile yazılır . Bir dizi basit ve önemli matematiksel özelliği vardır. Örneğin, x birçok birim ise, o zaman yaklaşık olarak
(I-) - x) \u003d x'te.
Bu yaklaşık ilişkiyi Bölüm 10'da kullandık .
İÇİNDEKİLER
SEMBOLLER 1
SİNYALLER 1
GÜRÜLTÜLER 1
J. Pierce 3
SEMBOLLER, SİNYALLER, SESLER 3
9-- ∣ β ⅛ 7
D.Bohm 170
M. Doğdu 170
Ek, MATEMATİKSEL NOTASYON 324 hakkında
J. Pierce
SEMBOLLER, SİNYALLER, SESLER
D.Bohm
ÖZEL
GÖRELİLİK
İngilizce'den çeviri
M. Doğdu
ATOM FİZİĞİ
Kitap, John Pierce'ın tipik üslubuyla yazılmıştır. Bu, popüler bir sunumda matematiksel bir iletişim teorisidir ve sadece onun hakkında konuşmak değildir. Okumak için, iletişim teknolojisi alanında özel bilgi gerekli değildir, yalnızca ısrarlı bir anlama ve anlama arzusu... Yazar, okuyucuyla konuşarak onu düşünmeye, itiraz etmeye ve nihayet mantıklı bir şekilde ana ifadelere gelmeye zorlar. teorinin. Bu nazikçe ama ısrarla yapılır. Bazen yazar, okuyucuyu neredeyse zorla sürükler ve ardından okuyucunun kendisi, merak uyandıran ve bilinmeyeni çağıran sayfa sayfa coşkuyla okur.
1 ∕ 2 incelik vb. Tabii ki, parçanın sözde tarzı konusunda herkesi uyardı.
Resimde. 13.3 iki örneği gösterir: her biri 1 / 2 olan bir koral parçası ölçü önceki 1 Z 2'ye göre eklendi ölçü ve her 1/2'lik bir "romantik kompozisyon" parçası önceki 3 / 2 ölçüsüne göre ölçü eklendi . Uygunsuz ve geçersiz akorlar ve akor dizilerinin görünmesine rağmen, bu "kompozisyonların" bir dereceye kadar aynı fikirde olması beni şaşırtıyor. Üslubun “kesinliği” de dikkat çekiyor. Açıktır ki, matematikçilerin neyin ne olduğu konusunda tamamen farklı fikirleri vardı.
Not: Bazen Büyük Dosyaları tarayıcı açmayabilir...İndirerek okumaya Çalışınız.
Yorumlar