ScholarGate
Asisten

Perangkat Lunak dan Komputasi Statistik

Perangkat lunak dan komputasi statistik berkaitan dengan bahasa, alat, dan praktik di mana metode statistik diimplementasikan, dibagikan, dan dijalankan secara andal serta dalam skala besar.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Perangkat lunak dan komputasi statistik adalah studi tentang bahasa, desain perangkat lunak, praktik reproduktifitas, dan teknik berkinerja tinggi yang digunakan untuk mengimplementasikan dan mengeksekusi metode statistik pada data dan perangkat keras nyata.

Scope

Area ini mencakup bahasa pemrograman dan lingkungan yang dibangun untuk analisis data, praktik yang membuat analisis komputasi dapat direproduksi, dan teknik yang memungkinkan komputasi statistik berskala besar untuk data besar melalui metode paralel dan berkinerja tinggi. Ini membahas sisi rekayasa komputasi statistik daripada algoritma spesifik, yang tercakup dalam area lain.

Sub-topics

Core questions

  • Fitur desain bahasa dan perangkat lunak apa yang membuat komputasi statistik ekspresif dan andal?
  • Bagaimana analisis statistik dibuat dapat direproduksi dan dibagikan?
  • Bagaimana komputasi statistik berskala besar untuk data besar dan banyak prosesor?
  • Bagaimana praktik perangkat lunak memengaruhi kepercayaan hasil statistik?

Key theories

Bahasa untuk analisis data
Lingkungan seperti R dan Python menyediakan operasi vektor, struktur data yang kaya, dan ekosistem paket yang dirancang di sekitar alur kerja statistik, membentuk cara analisis diekspresikan dan diperluas.
Reproduktifitas dan skala
Praktik penelitian yang dapat direproduksi dan teknik berkinerja tinggi bersama-sama menentukan apakah suatu analisis dapat dipercaya, diulang, dan diterapkan pada kumpulan data yang jauh lebih besar daripada yang dapat ditangani langsung oleh satu mesin.

Clinical relevance

Perangkat lunak dan praktik komputasi yang mengelilingi suatu analisis menentukan apakah hasilnya dapat direproduksi, diaudit, dan diskalakan; di era data besar dan alur kerja yang kompleks, masalah rekayasa ini sama pentingnya untuk kesimpulan yang valid seperti metode statistik yang mendasarinya.

History

Bahasa S di Bell Labs menetapkan model lingkungan interaktif untuk analisis data; penerusnya yang sumber terbuka, R, dan tumpukan Python ilmiah menjadi dominan, sementara volume data yang terus bertambah dan kekhawatiran reproduktifitas mengangkat praktik komputasi menjadi bidang studi tersendiri.

Key figures

  • John Chambers
  • Ross Ihaka
  • Robert Gentleman
  • James Gentle

Related topics

Seminal works

  • chambers2008
  • gentle2009

Frequently asked questions

Apakah perangkat lunak statistik benar-benar bagian dari statistik?
Ya. Metode yang dikembangkan oleh ahli statistik hanya berguna jika diimplementasikan dengan benar dan dapat dijalankan, sehingga desain bahasa statistik, alur kerja yang dapat direproduksi, dan komputasi yang skalabel merupakan bagian integral dari komputasi statistik.
Mengapa reproduktifitas menjadi begitu menonjol?
Karena analisis menjadi lebih kompleks dan berbasis data, hasilnya dapat bergantung pada kode yang tepat, versi data, dan lingkungan komputasi. Praktik yang dapat direproduksi memungkinkan untuk memverifikasi, menggunakan kembali, dan membangun di atas karya statistik yang diterbitkan.

Methods for this concept

Related concepts