ScholarGate
دستیار

زبان‌های برنامه‌نویسی آماری

زبان‌های برنامه‌نویسی آماری، محیط‌های محاسباتی هستند که حول محور تحلیل داده‌ها طراحی شده‌اند و عملیات برداری، فریم‌های داده، انتزاعات مدل‌سازی و سیستم‌های بسته‌ای قابل توسعه را در اختیار آمارشناسان قرار می‌دهند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

زبان برنامه‌نویسی آماری، یک زبان و محیط برنامه‌نویسی است که طراحی آن بر تحلیل داده‌ها متمرکز است و از محاسبات عددی برداری، ساختارهای داده آماری، مشخصات مدل، و توزیع روش‌های تحلیلی به عنوان بسته، پشتیبانی بومی ارائه می‌دهد.

Scope

این موضوع اصول طراحی زبان‌های ساخته شده برای آمار، تبار S و جانشین آن R، اکوسیستم علمی پایتون، و ویژگی‌های زبانی که برای کار با داده‌ها اهمیت دارند را پوشش می‌دهد: برداری‌سازی، ساختارهای داده برای داده‌های جدولی و گمشده، رابط‌های فرمول و مدل‌سازی، و اکوسیستم‌های بسته. الگوریتم‌های خاص خارج از محدوده هستند.

Core questions

  • چه ویژگی‌های زبانی، یک زبان برنامه‌نویسی را برای تحلیل داده‌ها مناسب می‌سازد؟
  • زبان S چگونه طراحی محیط‌های آماری مدرن را شکل داد؟
  • چگونه انتزاعات برداری‌سازی و فریم داده از کار آماری پشتیبانی می‌کنند؟
  • اکوسیستم‌های بسته چگونه یک زبان را با روش‌های آماری گسترش می‌دهند؟

Key concepts

  • برداری‌سازی
  • فریم داده
  • رابط فرمول
  • اکوسیستم بسته
  • ویژگی‌های تابعی و شی‌گرا
  • محیط تعاملی

Key theories

طراحی زبان برای تحلیل داده‌ها
زبان‌های آماری عملیات برداری، ساختارهای داده غنی برای داده‌های جدولی و گمشده، و رابط‌های مدل‌سازی مانند فرمول‌ها را فراهم می‌کنند، به طوری که قصد تحلیلی می‌تواند به طور مختصر بیان شود و از طریق بسته‌های ارائه‌شده توسط کاربر گسترش یابد.
تبار S به R
زبان S محیط تعاملی و شی‌گرای تحلیل داده‌ها را معرفی کرد که R آن را به عنوان نرم‌افزار متن‌باز بازسازی کرد، و مخزن بسته‌های آن، آن را به یک پلتفرم جامعه‌محور برای روش‌های آماری تبدیل کرد.

Clinical relevance

انتخاب و تسلط بر یک زبان آماری، نحوه نگارش، اعتبارسنجی و به اشتراک‌گذاری تحلیل‌ها را شکل می‌دهد؛ اکوسیستم‌های بسته باز R و پایتون، روش‌های پیشرفته را بلافاصله در دسترس متخصصان در سراسر علوم مبتنی بر داده قرار می‌دهند.

History

جان چمبرز و همکارانش S را در آزمایشگاه‌های بل در اواخر دهه 1970 ایجاد کردند؛ ایهاکا و جنتلمن R را به عنوان یک جانشین متن‌باز در سال 1996 منتشر کردند، و مخزن بسته‌های آن به علاوه ظهور موازی پشته علمی پایتون، اینها را به محیط‌های غالب برای محاسبات آماری تبدیل کرد.

Key figures

  • John Chambers
  • Ross Ihaka
  • Robert Gentleman
  • Hadley Wickham

Related topics

Seminal works

  • chambers2008
  • ihaka1996

Frequently asked questions

چه چیزی یک زبان را یک زبان برنامه‌نویسی آماری می‌سازد تا یک زبان عمومی؟
این زبان تحلیل داده‌ها را در هسته خود جای می‌دهد: ریاضیات برداری، ساختارهای داده جدولی با مدیریت مقادیر گمشده، نحو مشخصات مدل، و اکوسیستمی از بسته‌های آماری. زبان‌های عمومی می‌توانند آمار انجام دهند، اما اینها برای این منظور طراحی شده‌اند.
چرا برداری‌سازی در این زبان‌ها مورد تأکید است؟
عمل کردن بر روی کل بردارها و ماتریس‌ها به طور همزمان، کد را هم مختصر و هم سریع می‌کند، زیرا محاسبات سنگین در روال‌های کامپایل شده بهینه اجرا می‌شوند. همچنین با نحوه بیان طبیعی عملیات آماری بر روی داده‌ها مطابقت دارد.

Methods for this concept

Related concepts