زبانهای برنامهنویسی آماری
زبانهای برنامهنویسی آماری، محیطهای محاسباتی هستند که حول محور تحلیل دادهها طراحی شدهاند و عملیات برداری، فریمهای داده، انتزاعات مدلسازی و سیستمهای بستهای قابل توسعه را در اختیار آمارشناسان قرار میدهند.
Definition
زبان برنامهنویسی آماری، یک زبان و محیط برنامهنویسی است که طراحی آن بر تحلیل دادهها متمرکز است و از محاسبات عددی برداری، ساختارهای داده آماری، مشخصات مدل، و توزیع روشهای تحلیلی به عنوان بسته، پشتیبانی بومی ارائه میدهد.
Scope
این موضوع اصول طراحی زبانهای ساخته شده برای آمار، تبار S و جانشین آن R، اکوسیستم علمی پایتون، و ویژگیهای زبانی که برای کار با دادهها اهمیت دارند را پوشش میدهد: برداریسازی، ساختارهای داده برای دادههای جدولی و گمشده، رابطهای فرمول و مدلسازی، و اکوسیستمهای بسته. الگوریتمهای خاص خارج از محدوده هستند.
Core questions
- چه ویژگیهای زبانی، یک زبان برنامهنویسی را برای تحلیل دادهها مناسب میسازد؟
- زبان S چگونه طراحی محیطهای آماری مدرن را شکل داد؟
- چگونه انتزاعات برداریسازی و فریم داده از کار آماری پشتیبانی میکنند؟
- اکوسیستمهای بسته چگونه یک زبان را با روشهای آماری گسترش میدهند؟
Key concepts
- برداریسازی
- فریم داده
- رابط فرمول
- اکوسیستم بسته
- ویژگیهای تابعی و شیگرا
- محیط تعاملی
Key theories
- طراحی زبان برای تحلیل دادهها
- زبانهای آماری عملیات برداری، ساختارهای داده غنی برای دادههای جدولی و گمشده، و رابطهای مدلسازی مانند فرمولها را فراهم میکنند، به طوری که قصد تحلیلی میتواند به طور مختصر بیان شود و از طریق بستههای ارائهشده توسط کاربر گسترش یابد.
- تبار S به R
- زبان S محیط تعاملی و شیگرای تحلیل دادهها را معرفی کرد که R آن را به عنوان نرمافزار متنباز بازسازی کرد، و مخزن بستههای آن، آن را به یک پلتفرم جامعهمحور برای روشهای آماری تبدیل کرد.
Clinical relevance
انتخاب و تسلط بر یک زبان آماری، نحوه نگارش، اعتبارسنجی و به اشتراکگذاری تحلیلها را شکل میدهد؛ اکوسیستمهای بسته باز R و پایتون، روشهای پیشرفته را بلافاصله در دسترس متخصصان در سراسر علوم مبتنی بر داده قرار میدهند.
History
جان چمبرز و همکارانش S را در آزمایشگاههای بل در اواخر دهه 1970 ایجاد کردند؛ ایهاکا و جنتلمن R را به عنوان یک جانشین متنباز در سال 1996 منتشر کردند، و مخزن بستههای آن به علاوه ظهور موازی پشته علمی پایتون، اینها را به محیطهای غالب برای محاسبات آماری تبدیل کرد.
Key figures
- John Chambers
- Ross Ihaka
- Robert Gentleman
- Hadley Wickham
Related topics
Seminal works
- chambers2008
- ihaka1996
Frequently asked questions
- چه چیزی یک زبان را یک زبان برنامهنویسی آماری میسازد تا یک زبان عمومی؟
- این زبان تحلیل دادهها را در هسته خود جای میدهد: ریاضیات برداری، ساختارهای داده جدولی با مدیریت مقادیر گمشده، نحو مشخصات مدل، و اکوسیستمی از بستههای آماری. زبانهای عمومی میتوانند آمار انجام دهند، اما اینها برای این منظور طراحی شدهاند.
- چرا برداریسازی در این زبانها مورد تأکید است؟
- عمل کردن بر روی کل بردارها و ماتریسها به طور همزمان، کد را هم مختصر و هم سریع میکند، زیرا محاسبات سنگین در روالهای کامپایل شده بهینه اجرا میشوند. همچنین با نحوه بیان طبیعی عملیات آماری بر روی دادهها مطابقت دارد.