ScholarGate
Asistan

İstatistiksel Programlama Dilleri

İstatistiksel programlama dilleri, veri analizi etrafında tasarlanmış bilgi işlem ortamlarıdır; istatistikçilere vektörleştirilmiş işlemler, veri çerçeveleri, modelleme soyutlamaları ve genişletilebilir paket sistemleri sunmaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

İstatistiksel programlama dili, tasarımı veri analizine odaklanmış, vektörleştirilmiş sayısal hesaplama, istatistiksel veri yapıları, model belirtimi ve analitik yöntemlerin paketler halinde dağıtımı için yerel destek sağlayan bir programlama dili ve ortamıdır.

Kapsam

Bu kapsam, istatistik için geliştirilmiş dillerin tasarım prensiplerini, S soyunu ve halefi R'ı, bilimsel Python ekosistemini ve veri çalışmaları için önemli olan dil özelliklerini (vektörleştirme, tablo ve eksik veriler için veri yapıları, formül ve modelleme arayüzleri ve paket ekosistemleri) ele almaktadır. Belirli algoritmalar kapsam dışındadır.

Temel sorular

  • Hangi dil özellikleri bir programlama dilini veri analizi için uygun hale getirmektedir?
  • S dili, modern istatistiksel ortamların tasarımını nasıl şekillendirmiştir?
  • Vektörleştirme ve veri çerçevesi soyutlamaları istatistiksel çalışmaları nasıl desteklemektedir?
  • Paket ekosistemleri, bir dili istatistiksel yöntemlerle nasıl genişletmektedir?

Anahtar kavramlar

  • Vektörleştirme
  • Veri çerçevesi
  • Formül arayüzü
  • Paket ekosistemi
  • Fonksiyonel ve nesne yönelimli özellikler
  • Etkileşimli ortam

Temel kuramlar

Veri analizi için dil tasarımı
İstatistiksel diller, vektörleştirilmiş işlemler, tablo ve eksik veriler için zengin veri yapıları ve formüller gibi modelleme arayüzleri sağlamaktadır; böylece analitik amaçlar kısa ve öz bir şekilde ifade edilebilmekte ve kullanıcı katkılı paketler aracılığıyla genişletilebilmektedir.
S'ten R'a soy
S dili, R'ın açık kaynaklı yazılım olarak yeniden uyguladığı etkileşimli, nesne yönelimli veri analizi ortamını tanıtmıştır; R'ın paket deposu ise bu dili istatistiksel yöntemler için topluluk odaklı bir platforma dönüştürmüştür.

Klinik önem

İstatistiksel bir dilin seçimi ve kullanımı, analizlerin nasıl yazıldığını, doğrulandığını ve paylaşıldığını şekillendirmektedir; R ve Python'ın açık paket ekosistemleri, veri odaklı bilimlerdeki uygulayıcılara en son yöntemleri anında erişilebilir kılmaktadır.

Tarihçe

John Chambers ve meslektaşları, 1970'lerin sonlarında Bell Labs'te S'i geliştirmiştir; Ihaka ve Gentleman, 1996'da R'ı açık kaynaklı bir halef olarak yayınlamış ve R'ın paket deposu ile bilimsel Python yığınının paralel yükselişi, bunları istatistiksel hesaplama için baskın ortamlar haline getirmiştir.

Öne çıkan isimler

  • John Chambers
  • Ross Ihaka
  • Robert Gentleman
  • Hadley Wickham

İlgili konular

Temel eserler

  • chambers2008
  • ihaka1996

Sıkça sorulan sorular

Bir dili genel bir dil yerine istatistiksel bir programlama dili yapan nedir?
Veri analizini çekirdeğine dahil etmektedir: vektörleştirilmiş matematik, eksik değer işleme özellikli tablo veri yapıları, model belirtim sözdizimi ve istatistiksel paketlerden oluşan bir ekosistem. Genel diller istatistik yapabilse de, bu diller özellikle bu amaç için tasarlanmıştır.
Bu dillerde vektörleştirmeye neden vurgu yapılmaktadır?
Tüm vektörler ve matrisler üzerinde aynı anda işlem yapmak, yoğun hesaplama optimize edilmiş derlenmiş rutinlerde çalıştığı için kodu hem kısa hem de hızlı hale getirmektedir. Ayrıca, istatistiksel işlemlerin veriler üzerinde doğal olarak ifade edilme şekliyle de uyumludur.

Bu kavram için yöntemler

İlgili kavramlar