أكثر

اختبار الأهمية لموران أنا باستخدام محاكاة مونت كارلو؟

اختبار الأهمية لموران أنا باستخدام محاكاة مونت كارلو؟


لقد حسبت القيم المتبقية لنموذجي وقمت بقياس Moran I لبقايا النموذج.

كيف يمكنني بشكل عملي تحديد أهمية موران أنا باستخدام محاكاة مونت كارلو؟


إن طلب محاكاة "مونت كارلو" يشبه طلب تحديد الأهمية باستخدام الضرب: مثل الضرب ، فإن مونت كارلو هي مجرد تقنية حسابية. وبالتالي ، علينا أولا أن نفهم ماذا او ما يجب علينا الحوسبة.

أود أن أقترح التفكير في اختبار التقليب. الفرضية الصفرية هي أنه تم تحديد البيانات ثم تعيينها إلى مواقعها المكانية بشكل عشوائي. البديل هو أن التخصيص لكل موقع يعتمد (بطريقة ما) على المهمة في جيران ذلك الموقع. توزيع أي يمكن الحصول على قياس الارتباط الذاتي المكاني من خلال البناء الكل الاحالات الممكنة. لا يقوم اختبار التقليب بعشوائية على المجموعات المحتملة من قيم البيانات - فهو يعتبرها معطاة - ولكن الشرط بناءً على البيانات التي تمت ملاحظتها ، يأخذ في الاعتبار جميع الطرق الممكنة لإعادة تخصيصها للمواقع.

مثل هذا التعيين هو أ التقليب. إلى عن على ن نقاط البيانات ، هناك ن! = n * (n-1) * (n-2) * ... * (2) * (1) التباديل. إلى عن على ن أكبر بكثير من 10 أو نحو ذلك ، هذا كثير جدًا ولا يمكن إنشاؤه. لا يوجد عادةً تعبير تحليلي بسيط لتوزيع التقليب الكامل أيضًا. وفقًا لذلك ، نلجأ عادةً إلى أخذ عينات من مجموعة التباديل بشكل عشوائي ، مما يمنحهم جميعًا وزنًا متساويًا. توزيع إحصائية الترابط الذاتي في عينة كبيرة بما فيه الكفاية (عادةً ما تتضمن 500 تبديل على الأقل) يقارب التوزيع الحقيقي. هذا هو جزء "مونت كارلو" من الحساب.

في حالة Moran I ، فإن القيمة الإيجابية الكبيرة هي دليل على وجود ارتباط إيجابي والقيمة السلبية الكبيرة هي دليل على الارتباط السلبي. يمكنك اختبار أحدهما أو كليهما عن طريق تحديد القيمة الفعلية لـ I (للبيانات كما لوحظ) ضمن توزيع التقليب. القيمة p هي نسبة توزيع التقليب (بما فيها القيمة المرصودة لـ I) أكثر تطرفًا من الإحصاء المرصود.

سوف توضح الأمثلة التالية. في كليهما ، تم إنشاء بيانات على شبكة 5 × 8. تتناسب الأوزان مع 1 للخلايا التي تشترك في جانب ، و sqrt (1/2) = 0.7071 للخلايا التي تشترك في الزاوية فقط ، وتتناسب مع 0 بخلاف ذلك. يرسم العمود الأيسر البيانات (الأصفر أعلى من الأحمر) ؛ يظهر العمود الأوسط الرسوم البيانية للبيانات ؛ ويعرض العمود الأيمن توزيع التقليب المقدر لـ Moran I (باستخدام عينة من 10000). توضح الخطوط المنقطة الحمراء العمودية القيم الفعلية لـ Moran I في البيانات.

في حالة البيانات التي تنتجها آلية تؤدي إلى بعض الارتباط التلقائي (الصف العلوي) ، تكون هذه القيمة قريبة من الحدود القصوى للتوزيع: 4.53٪ فقط تساويها أو تتجاوزها. غالبًا ما يعتبر هذا دليلًا مهمًا على الارتباط الذاتي الإيجابي. في حالة البيانات التي تم إنشاؤها باستخدام آلية عشوائية بحتة (الصف السفلي) ، يكون Moran I بالقرب من منتصف التوزيع (تقريبًا تقريبًا بمتوسط ​​قيمته -1/39 = -0.026). لا أحد يخلط بين هذا وبين نتيجة مهمة. في هذه الأمثلة ، إذن ، يعمل اختبار التقليب على النحو المنشود.

لاحظ التوزيع المنحرف للغاية للبيانات المرتبطة تلقائيًا. تم ذلك عمدا. لا تتوافق هذه البيانات المنحرفة مع الافتراضات (الضمنية) المستخدمة لتبرير التفسيرات المعيارية لـ Moran I. (يشهد التوزيع الفارغ المنحرف على ذلك: تفترض التفسيرات المعيارية أنه لا يوجد أي انحراف على الإطلاق). ينتج عن اختبار التقليب نتائج أكثر موثوقية من الاختبار "المعلب" بناءً على إحالة "درجة Z" إلى التوزيع الطبيعي.

لاختبار بقايا النموذج ، في كل تكرار ، عادة ما تقوم بتبديل المخلفات ، وتجديد النموذج ، وحساب Moran I من تلك المخلفات الجديدة.


مراجع

فيليب جود ، اختبارات التقليب والبارامترية والتمهيد للفرضيات. الطبعة الثالثة (2005) ، سبرينغر.


ما يليصولدت التعليمات البرمجية الأمثلة. إنه غير مخصص للعمل الإنتاجي: فهو غير فعال في توليد مصفوفة الأوزان كما أنه يفتقر إلى مساحة كبيرة في تخزينه. (ميزته أنه يحسب Moran I بسرعة بمجرد تحديد الأوزان ، وهو مثالي لاختبار التقليب لأن الأوزان لا تتغير أبدًا.)

# # موران أنا # https://en.wikipedia.org/wiki/Moran's_I # # مواقع البيانات. # x <- 1: 8 # x إحداثيات النقاط y <- 1: 5 # y- إحداثيات النقاط # # مصفوفة الأوزان. # ind <- expand.grid (i = 1: length (x)، j = 1: length (y)) f <- function (i، j) {u <- min (3، sum (abs (ind [i ،] - ind [j،]))) c (0، 1، sqrt (1/2)، 0) [u + 1]} w <- matrix (0.0، nrow (ind)، nrow (ind)) من أجل (i in 1: nrow (ind)) لـ (j in 1: nrow (ind)) w [i، j] <- f (i، j) w <- w / sum (w) # # Moran's I. # موران <- دالة (س ، أوزان) {ن <- الطول (س) ع <- مثل المتجه ((س - يعني (س)) / sd (س)) كمتجه (z٪ *٪ أوزان٪ *٪ (z * sqrt (n / (n-1))))} # # اختبار التقليب (بما في ذلك المؤامرة). # ppt <- الوظيفة (z، w، N = 1e4،…) {stat <- moran (z، w) sim <- تكرار (N ، Moran (sample (z، length (z))، w)) p. القيمة <- يعني ((all <- c (stat، sim))> = stat) hist (sim، sub = لصق ("p ="، round (p.value، 4))، xlim = range (all)، …) abline (v = stat ، col = "# 903030" ، lty = 3 ، lwd = 2) إرجاع (p.value)} # # محاكاة الملاحظات. # set.seed (17) par (mfrow = c (2،3)) # حث على الارتباط التلقائي عبر اتجاه أساسي. z <- المصفوفة (rexp (الطول (x) * الطول (y) ، الخارجي (x ، y ^ 2)) ، الطول (x)) الصورة (السجل (z) ، الرئيسي = "البيانات المرتبطة تلقائيًا") هيست (z) ppt (z، w، main = "Null Distribution of Moran's I"، xlab = "I") # إنشاء البيانات بشكل مستقل عن الموقع. z <- المصفوفة (rnorm (length (x) * length (y)، 0، 1/2)، length (x)) image (z، main = "Uncorrelated Data") hist (z) ppt (z، w main = "Null Distribution of Moran's I"، xlab = "I")

شاهد الفيديو: Part 1: Monte Carlo Simulations in MATLAB Tutorial