تصميم بايزي تجريبي

يوفر التصميم البايزي التجريبي (نسبةً لبايز) إطار احتمالٍ نظريًّا عامًّا يمكن استنباط نظريات تصميم تجريبي أخرى منه. وهو مبني على الاستدلال البايزي لتفسير البيانات/الملاحظات التي حُصل عليها خلال التجربة. يسمح هذا بالتعويض عن أي معرفة مسبقة عن المؤشرات التي يجب تحديدها، بالإضافة إلى أي شكوك في الملاحظات.

نظرية التصميم البايزي التجريبي مبنية إلى حد ما على نظرية صنع القرارات المثالية عند وجود شك. الهدف عند تصميم تجربة هو الخروج بأعلى حد ممكن من الفائدة المتوقعة لنتيجة التجربة. التعريف الأكثر شيوعًا للفائدة هو أنها قياس لدقة المعلومات التي توفرها التجربة (مثل معلومات شانون أو التنوع السلبي)، ولكن يمكن أيضًا أن تشمل عوامل كالكلفة المالية لإجراء التجربة. تعتمد ماهية التصميم المثالي للتجربة على معيار الفائدة المحدد المختار.

علاقات لنظرية تصميم مثالي أكثر تخصصًا

النظرية الخطية

إذا كان النموذج خطيًّا، فإن دالة كثافة الاحتمال السابقة متجانسة، وتتوزع أخطاء الملاحظة بانتظام، تتبسط النظرية لتأخذ شكل نظرية التصميم التجريبي المثالي التقليدية (الكلاسيكية).

الانتظام التقريبي

يفترض (غالبًا بشكل ضمني) في العديد من الكتابات المتعلقة بموضوع التصميم البايزي التجريبي أن كل دوال كثافة الاحتمال التالية منتظمة تقريبًا. يسمح هذا بحساب الفائدة المتوقعة عن طريق النظرية الخطية، بأخذ المتوسط على كامل فضاء مؤشرات النموذج، وهي طريقة راجعها تشالونر وفيردينيللي (1995). ولكن يجب أخذ الحذر عند تطبيق هذه الطريقة، بما أنه من الصعب التحقق من الانتظام التقريبي لكل الدوال التالية، حتى في حالات أخطاء الملاحظة العادية ودوال كثافة الاحتمال السابقة المنتظمة.

التوزيع البعدي

أصبح المزيد من الموارد الحاسوبية يسمح حديثًا باستقراء التوزيع البعدي لمؤشرات النموذج، التي يمكن استخدامها مباشرةً للتصميم التجريبي. اقترح فانلير وزملاؤه (2012) طريقةً تستخدم التوزيع البعدي الاستقرائي لتقييم أثر القياسات الجديدة على الشك في توقع الاحتمالات، في حين اقترح ليبي وزملاؤه (2013) أخذ أكبر قدر ممكن من المعلومات بين المؤشرات، والتوقعات، والتجارب الجديدة المحتملة.

الصيغة الرياضية

بأخذ شعاع θ بمؤشرات يجب تحديدها، ودالة كثافة احتمال مسبقة p(θ) لهذه المؤشرات (البارامترات) ودالة كثافة احتمال p(yθ,ξ) لإجراء الملاحظات y، بأخذ قيم للمؤشرات θ وتصميم تجريبي ξ، يمكن عندها حساب دالة كثافة الاحتمال البعدية باستخدام فرضية بايز:

p(θy,ξ)=p(yθ,ξ)p(θ)p(yξ),

حيث p(yξ) كثافة الاحتمال الهامشية في فضاء العيان

p(yξ)=p(θ)p(yθ,ξ)dθ.

الاستفادة المتوقعة للتجربة ذات التصميم ξ يمكن تعريفها كالتالي

U(ξ)=p(yξ)U(y,ξ)dy,

حيث U(y,ξ) تابع ما ذو قيمة حقيقية لدالة كثافة الاحتمال البعدية p(θy,ξ) بعد إجراء الملاحظة y باستخدام تصميم تجريبي ξ.

الربح في معلومات شانون كفائدة

يمكن تعريف الفائدة بأنها الربح المسبق البعدي في معلومات شانون

U(y,ξ)=log(p(θy,ξ))p(θ|y,ξ)dθlog(p(θ))p(θ)dθ.

الاحتمال الآخر هو تعريف الفائدة بأنها

U(y,ξ)=DKL(p(θy,ξ)|p(θ)),

تفرق كولباك-لايبلر للسابق من التوزيع البعدي. لاحظ ليندلي (1956) أن الفائدة المتوقعة ستكون مستقلة عن الإحداثيات عندها ويمكن كتابتها بشكلين:

U(ξ)=log(p(θy,ξ))p(θ,yξ)dθdylog(p(θ))p(θ)dθ=log(p(yθ,ξ))p(θ,yξ)dydθlog(p(yξ))p(yξ)dy,

يمكن تقييم الشكل الثاني دون الحاجة لتقييم دوال كثافة الاحتمال البعدية الفردية p(θy,ξ) لكل الملاحظات المحتملة y. من الجدير ذكر أن الحد الأول من السطر الثاني من المعادلة لا يعتمد على التصميم ξ، طالما أن الشك لا يعتمد عليه كذلك. من جهة أخرى، تكامل p(θ)logp(θ) في الشكل الأول ثابت لأجل أي ξ، لذا إذا كان الهدف اختيار التصميم ذي الفائدة الأكبر، فليس من الضروري حساب الحد على الإطلاق. درس العديد من المؤلفين طرائق عددية لتقييم هذا المعيار وإيجاد القيمة المثالية له، ومنهم فان دن بيرغ، وكورتيس ترامبرت (2003)، ورايان (2003). نلاحظ أن:

U(ξ)=I(θ;y),

ربح المعلومات المتوقع هو بالضبط المعلومات المشتركة بين المؤشر (البارامتر) θ والملاحظة y. ذكر بانيا (2019) مثالًا عن التصميم البايزي لتمييز النموذج الديناميكي الخطي. بما أن I(θ;y), من الصعب حسابه، يستخدم حده الأدنى كتابع للفائدة. توجد القيمة الأعظمية للحد الأدنى عندها وفق شرط طاقة الإشارة. قورن التصميم البايزي المقترح بالتصميم المثالي (دي-المثالي) التقليدي المتوسط. ظهر أن التصميم البايزي أفضل من تصميم (دي المثالي).

يصف معيار كيلي أيضًا دالة فائدة كذلك لأجل مقامر يسعى لجعل ربحه أعظم ما يمكن، يستخدم في نظرية المقامرة والمعلومات؛ وضع كيلي مطابق لما سبق، بأخذ المعلومات الجانبية أو «الشبكة الخاصة» محل التجربة.

المراجع