ค่าสัมประสิทธิ์การกำหนด r2 แสดงถึงสัดส่วนของการแปรผันของตัวแปร ค่าสัมประสิทธิ์การตัดสินใจ

การเบี่ยงเบนของตัวแปรตามจากค่าเฉลี่ย ตัวแปรตามถูกอธิบาย (ทำนาย) โดยใช้ฟังก์ชันของตัวแปรอธิบาย ในบางกรณี มันคือกำลังสองของสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรตามและค่าที่ทำนายไว้โดยใช้ตัวแปรอธิบาย แล้วเราจะพูดอย่างนั้นได้ รูปที่ 2 แสดงสัดส่วนของความแปรปรวนของคุณลักษณะผลลัพธ์ที่อธิบายโดยอิทธิพลของตัวแปรอธิบาย

สูตรคำนวณค่าสัมประสิทธิ์การตัดสินใจ:

ที่ไหน ยี่คือค่าที่สังเกตได้ของตัวแปรตาม และ ฟิ- ค่าของตัวแปรตามที่ทำนายโดยสมการถดถอย - ค่าเฉลี่ยเลขคณิตของตัวแปรตาม

[แก้]ปัญหาและคุณสมบัติทั่วไป 2

[ แก้ไข ] การตีความ

บางครั้งตัวบ่งชี้ความใกล้ชิดของการสื่อสารสามารถได้รับการประเมินเชิงคุณภาพ (ระดับ Chaddock):

การวัดความใกล้ชิดในการเชื่อมต่อเชิงปริมาณ

ลักษณะเชิงคุณภาพของความแข็งแรงของพันธะ

ปานกลาง

สังเกตเห็นได้ชัดเจน

สูงมาก

การเชื่อมต่อการทำงานเกิดขึ้นเมื่อค่าเป็น 1 และไม่มีการเชื่อมต่อเป็น 0 ด้วยค่าความใกล้ชิดของการเชื่อมต่อน้อยกว่า 0.7 ค่าสัมประสิทธิ์การกำหนดจะต่ำกว่า 50% เสมอ ซึ่งหมายความว่าความแปรผันในลักษณะปัจจัยมีส่วนน้อยกว่าเมื่อเทียบกับปัจจัยอื่น ๆ ที่ไม่ได้คำนึงถึงในแบบจำลองที่มีอิทธิพลต่อการเปลี่ยนแปลงตัวบ่งชี้ประสิทธิภาพ แบบจำลองการถดถอยที่สร้างขึ้นภายใต้เงื่อนไขดังกล่าวมีความสำคัญเชิงปฏิบัติต่ำ

[แก้ไข] คุณสมบัติทั่วไปสำหรับการถดถอย OLS

การถดถอยพหุคูณเชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุด (OLS) เป็นการใช้ค่าสัมประสิทธิ์การกำหนดที่พบบ่อยที่สุด 2.

การถดถอย OLS หลายเส้นเชิงเส้นมีดังต่อไปนี้ คุณสมบัติทั่วไป :

1. ยิ่งค่าเข้าใกล้ 1 มากเท่าใด โมเดลก็ยิ่งเข้าใกล้การสังเกตเชิงประจักษ์มากขึ้นเท่านั้น

2. เมื่อจำนวนตัวแปรอธิบายเพิ่มขึ้น 2.

[แก้ไข] คุณสมบัติทั่วไปสำหรับการถดถอย OLS ด้วยคำจำลอง (ปัจจัยเดียว)

สำหรับกรณีที่ปรากฏอยู่ในภาวะถดถอยดังกล่าว สมาชิกฟรีค่าสัมประสิทธิ์การตัดสินใจมีคุณสมบัติดังต่อไปนี้:

1. รับค่าจากช่วงเวลา (เซ็กเมนต์)

2. ในกรณีของแบบจำลองการถดถอยเชิงเส้น OLS คู่ สัมประสิทธิ์การกำหนดจะเท่ากับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ นั่นคือ 2 = 2. และในกรณีของการถดถอย OLS หลายครั้ง 2 = (;)2. นอกจากนี้ยังเป็นความสัมพันธ์แบบเพียร์สันกำลังสองระหว่างตัวแปรสองตัวด้วย เป็นการแสดงออกถึงจำนวนความแปรปรวนที่ใช้ร่วมกันระหว่างสองตัวแปร

3. 2 สามารถย่อยสลายได้ตามการมีส่วนร่วมของแต่ละปัจจัยต่อค่า 2 และการมีส่วนร่วมของแต่ละปัจจัยดังกล่าวจะเป็นค่าบวก การสลายตัวที่ใช้คือ: , ที่ไหน 0เจ- ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของตัวแปรตามและตัวแปรอธิบายที่สอดคล้องกับดัชนีที่สอง

4. 2 เกี่ยวข้องกับการทดสอบสมมติฐานว่าค่าที่แท้จริงของสัมประสิทธิ์ของตัวแปรอธิบายมีค่าเท่ากับศูนย์ เมื่อเปรียบเทียบกับสมมติฐานทางเลือกที่ว่าค่าจริงของสัมประสิทธิ์ไม่เท่ากับศูนย์ทั้งหมด แล้วตัวแปรสุ่ม มีการแจกแจงแบบ F โดยมีดีกรีอิสระ (k-1) และ (n-k)

[แก้ไข] การถดถอยเชิงจินตภาพ

ค่านิยม 2, , เรื่องจริง" href="/text/category/bilmz/" rel="bookmark">ตรวจสอบข้อเท็จจริงหรือเปรียบเทียบโดยใช้ 2 และการปรับเปลี่ยน

[แก้ไข] การแก้ไขปัญหาหรือแก้ไข 2

[แก้ไข] 2-ปรับ

เพื่อป้องกันไม่ให้นักวิจัยเพิ่มมากขึ้น 2 โดยการเพิ่มปัจจัยภายนอก 2 ถูกแทนที่ด้วยอันที่แก้ไขแล้ว https://pandia.ru/text/79/148/images/image006_10.gif" alt="R_(extensed)^2" width="72" height="23 src=">, который будет совпадать с исходным для случая МНК регрессии со свободным членом, и для которого будут продолжать выполняться четыре свойства перечисленые выше. Суть этого метода заключается рассмотрении проекции единичного вектора на плоскость объясняющих переменных .!}
สำหรับกรณีของการถดถอยโดยไม่มีคำจำลอง:
,
โดยที่ X คือเมทริกซ์ nxk ของค่าตัวประกอบ (เอ็กซ์) = เอ็กซ์ * (เอ็กซ์" * เอ็กซ์) − 1 * เอ็กซ์" - โปรเจ็กเตอร์บนระนาบ X https://pandia.ru/text/79/148/images/image006_10.gif" alt="R_(extensed)^2" width="72" height="23">!} มีการปรับเปลี่ยนเล็กน้อยยังเหมาะสำหรับการเปรียบเทียบการถดถอยที่สร้างโดยใช้: OLS, กำลังสองน้อยที่สุดทั่วไป (GLM), กำลังสองน้อยที่สุดแบบมีเงื่อนไข (CMLS), กำลังสองน้อยสุดแบบมีเงื่อนไขทั่วไป (GCM)

[แก้ไข] 2-จริง (เป็นกลาง)

<---Будет добавлен---!>

[แก้ไข]เกณฑ์อื่นๆ ที่ใช้

AIC - Akaike Information Criterion - ใช้เพื่อการเปรียบเทียบระหว่างรุ่นเท่านั้น ยังไง มูลค่าน้อยลงยิ่งดีเท่าไร มักใช้ในรูปแบบของการเปรียบเทียบแบบจำลองอนุกรมเวลาด้วย จำนวนเงินที่แตกต่างกันล่าช้า
- ให้โทษเล็กน้อยสำหรับการรวมความล่าช้าเพิ่มเติมในแบบจำลองมากกว่า BIC
BIC - เกณฑ์ข้อมูล Schwartz - ถูกใช้และตีความคล้ายกับ AIC
- ให้โทษที่ใหญ่กว่าสำหรับการรวมความล่าช้าเพิ่มเติมในแบบจำลองมากกว่า BIC (ดูสูตร)

[แก้ไข]ดู อีกด้วย

§ ค่าสัมประสิทธิ์สหสัมพันธ์

§ ความสัมพันธ์

§ ความหลากหลาย

§ ความแปรปรวนของตัวแปรสุ่ม

§ วิธีการบัญชีกลุ่มของการโต้แย้ง

§ การวิเคราะห์การถดถอย

[แก้ไข]หมายเหตุ

1. 1 2 , เศรษฐมิติ. หลักสูตรเริ่มต้น.. - ฉบับที่ 6,7,8 เพิ่มเติม และประมวลผล.. - มอสโก: Delo, 2004. - T. "" - 576 หน้า -ISBN-X

2. 1 2 การขยายค่าสัมประสิทธิ์การกำหนดไปสู่กรณีทั่วไปของการถดถอยเชิงเส้นที่ประมาณโดยใช้วิธีกำลังสองน้อยที่สุดเวอร์ชันต่างๆ (รัสเซีย, อังกฤษ) // ซีมี ราสเศรษฐศาสตร์และระเบียบวิธีทางคณิตศาสตร์ - มอสโก: CEMI RAS, 2545 - V. 3. - T. 38. - หน้า 107-120

3. , สถิติประยุกต์ พื้นฐานของเศรษฐมิติ (ใน 2 เล่ม) - - มอสโก: Unity-Dana (โครงการ TASIS), 2544 - ต. "1,2" - 1,088 น. - ไอเอสบีเอ็น -8

4. ทางเลือกของการถดถอยที่ช่วยเพิ่มค่าประมาณสัมประสิทธิ์การกำหนดที่เป็นกลาง (รัสเซีย, อังกฤษ) // เศรษฐมิติประยุกต์ - มอสโก: Market DS, 2008. - V. 4. - T. 12. - หน้า 71-83.

[แก้ไข] ลิงค์

§ อภิธานคำศัพท์ทางสถิติ

§ เศรษฐมิติประยุกต์ (วารสาร)

สิ่งที่สำคัญที่สุดคือ: ตัวบ่งชี้นี้วัดระดับการพึ่งพาของการแปรผันของค่าหนึ่งกับค่าอื่นๆ มากมาย ใช้เพื่อประเมินคุณภาพของการถดถอยเชิงเส้น

สูตรการคำนวณ:

R^2 \equiv 1-(\sum_i (y_i - f_i)^2 \over \sum_i (y_i-\bar(y))^2),

  • \bar(y) – อ้างอิง เลขคณิตของตัวแปรตาม
  • ไฟ-ความหมาย ตัวแปรตามสมการสมการถดถอย
  • yi คือค่าของตัวแปรตามที่กำลังศึกษาอยู่

ความมุ่งมั่นมันคืออะไร - คำจำกัดความ

ค่าสัมประสิทธิ์การกำหนดเป็นส่วนหนึ่งของความแปรปรวนของตัวแปร (ขึ้นอยู่กับ) ซึ่งถูกกำหนดโดยแบบจำลองการพึ่งพาเฉพาะ หน่วยนี้จะช่วยลบส่วนแบ่งของความแปรปรวนอธิบายไม่ได้ของความแปรปรวนของตัวแปรตาม

ตัวบ่งชี้นี้สามารถรับค่าได้ตั้งแต่ 0 ถึง 1 ยิ่งค่าของมันเข้าใกล้ 1 มากเท่าใด ลักษณะผลลัพธ์ก็จะสัมพันธ์กับปัจจัยที่กำลังศึกษามากขึ้นเท่านั้น

เพราะ อาชญากรรมเป็นผลมาจากความเชื่อมโยงระหว่างพฤติกรรมกับ คุณสมบัติส่วนบุคคลตัวบ่งชี้นี้ในกิจกรรมของหน่วยงานที่เกี่ยวข้องได้รับการคำนวณเพื่อประเมินคุณภาพของพฤติกรรมทางอาญา ให้แนวคิดว่าอะไรคือสาเหตุที่เป็นไปได้ของอาชญากรรม แรงจูงใจคืออะไร สาเหตุและเงื่อนไขสำหรับสิ่งนี้คืออะไร

ค่าสัมประสิทธิ์การตัดสินใจแสดงอะไร?

ค่าสัมประสิทธิ์นี้แสดงให้เห็นถึงความแปรผันของคุณลักษณะที่มีประสิทธิผลจากอิทธิพลของคุณลักษณะของปัจจัย ซึ่งมีความสัมพันธ์อย่างใกล้ชิดกับจำนวนสหสัมพันธ์ หากไม่มีการเชื่อมต่อ ตัวบ่งชี้จะเป็นศูนย์ หากมีการเชื่อมต่อ แสดงว่าเป็นหนึ่ง
มีคำจำกัดความของ determinism เป็นหลักการของโครงสร้างโลก พื้นฐานของแนวคิดนี้คือความเชื่อมโยงระหว่างปรากฏการณ์ทั้งหมด หลักคำสอนนี้ปฏิเสธการมีอยู่ของสิ่งต่าง ๆ นอกเหนือจากความสัมพันธ์กับโลก

สิ่งที่ตรงกันข้ามคือความไม่แน่นอน มันเกี่ยวข้องกับการปฏิเสธความสัมพันธ์เชิงวัตถุของการตัดสินใจ หรือการปฏิเสธความเป็นเหตุเป็นผล

ระดับพันธุกรรมคือความเชื่อที่ว่าสิ่งมีชีวิตทุกชนิดพัฒนาภายใต้การควบคุมทางพันธุกรรม

ปัจจัยกำหนดอาชญากรรมในอาชญาวิทยาถือเป็นปรากฏการณ์ทางสังคมที่การกระทำสามารถก่อให้เกิดอาชญากรรมได้

ด้วยการใช้การคำนวณประเภทนี้ คุณสามารถประเมินอิทธิพลทางสังคมวัฒนธรรมที่น่าจะเป็นของปัจจัยต่าง ๆ ที่มีต่อการพัฒนาของแต่ละบุคคล และสันนิษฐานว่าบุคคลจะประพฤติตัวอย่างไร เช่น ในการสื่อสารทางธุรกิจ และเพื่อประเมินอย่างเป็นกลางว่าเขาเหมาะสมกับสาธารณะหรือไม่ การบริหารหรือการรับราชการทหาร

ค่าสัมประสิทธิ์ยังกำหนดด้วยว่าดัชนีถูกเลือกอย่างถูกต้องสำหรับการคำนวณค่าสัมประสิทธิ์เบต้าและอัลฟ่าหรือไม่ หาก % ต่ำกว่า 75 สำหรับดัชนีบางดัชนี ค่าเบต้าและอัลฟ่าสำหรับดัชนีนั้นจะไม่ถูกต้อง

ดัชนีความมุ่งมั่น

ดัชนีความมุ่งมั่นคือกำลังสองของดัชนี ความสัมพันธ์ของการเชื่อมต่อแบบไม่เชิงเส้น ค่านี้แสดงลักษณะเปอร์เซ็นต์ที่แบบจำลองการถดถอยใช้อธิบายตัวแปรของตัวแปรประสิทธิภาพโดยสัมพันธ์กับระดับเฉลี่ย

สูตร



ปรับค่าสัมประสิทธิ์การตัดสินใจแล้ว

สาระสำคัญ แนวคิดนี้มีดังต่อไปนี้: ดัชนีนี้แสดงสัดส่วนของความแปรปรวนในตัวแปรผลลัพธ์ (ทั้งหมด) อธิบายโดยตัวแปรของตัวแปรปัจจัยที่รวมอยู่ในแบบจำลองการถดถอย: (เพิ่มขึ้น, ลดลง)

ค่าสัมประสิทธิ์การตัดสินใจ

ค่าสัมประสิทธิ์การตัดสินใจ ( - R-สแควร์) คือสัดส่วนของความแปรปรวนในตัวแปรตามซึ่งอธิบายโดยแบบจำลองการพึ่งพาที่กำลังพิจารณา นั่นคือ ตัวแปรอธิบาย แม่นยำยิ่งขึ้น มันคือค่าหนึ่งลบด้วยส่วนแบ่งของความแปรปรวนที่ไม่สามารถอธิบายได้ (ความแปรปรวนของข้อผิดพลาดแบบสุ่มของแบบจำลอง หรือการแปรปรวนแบบมีเงื่อนไขของปัจจัย-เงื่อนไขของตัวแปรตาม) ในความแปรปรวนของตัวแปรตาม ถือเป็นการวัดสากลของการเชื่อมต่อระหว่างตัวแปรสุ่มตัวหนึ่งกับตัวแปรสุ่มตัวอื่น ๆ ในกรณีพิเศษ การพึ่งพาเชิงเส้นคือกำลังสองของสิ่งที่เรียกว่าสัมประสิทธิ์สหสัมพันธ์พหุคูณระหว่างตัวแปรตามและตัวแปรอธิบาย โดยเฉพาะอย่างยิ่งสำหรับแบบจำลองการถดถอยเชิงเส้นแบบคู่ สัมประสิทธิ์การกำหนดจะเท่ากับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ตามปกติระหว่าง และ x.

ความหมายและสูตร

ค่าสัมประสิทธิ์ที่แท้จริงของการกำหนดแบบจำลองการพึ่งพาของตัวแปรสุ่ม y บนปัจจัย x ถูกกำหนดดังนี้:

โดยที่ ความแปรปรวนแบบมีเงื่อนไข (โดยปัจจัย x) ของตัวแปรตาม (ความแปรปรวนข้อผิดพลาดแบบสุ่มของแบบจำลอง)

ใน คำจำกัดความนี้มีการใช้พารามิเตอร์จริงที่แสดงถึงลักษณะการแจกแจง ตัวแปรสุ่ม- หากเราใช้ค่าประมาณตัวอย่างของค่าความแปรปรวนที่สอดคล้องกัน เราจะได้สูตรสำหรับค่าสัมประสิทธิ์การกำหนดตัวอย่าง (ซึ่งโดยปกติจะหมายถึงค่าสัมประสิทธิ์การกำหนด):

โดยที่ผลรวมของกำลังสองของการถดถอยที่เหลือคือค่าจริงและค่าที่คำนวณได้ของตัวแปรที่อธิบาย

ผลรวมของกำลังสอง

ในกรณีของการถดถอยเชิงเส้น มีค่าคงที่โดยที่ผลรวมของกำลังสองอธิบายอยู่ที่ไหน ดังนั้นเราจึงได้คำจำกัดความที่ง่ายกว่าในกรณีนี้ - ค่าสัมประสิทธิ์การกำหนดคือสัดส่วนของผลรวมของกำลังสองที่อธิบายไว้ทั้งหมด:

ต้องเน้นย้ำว่าสูตรนี้ใช้ได้กับโมเดลที่มีค่าคงที่เท่านั้น ในกรณีทั่วไป จำเป็นต้องใช้สูตรก่อนหน้า

การตีความ

1. ค่าสัมประสิทธิ์การกำหนดสำหรับแบบจำลองที่มีค่าคงที่จะใช้ค่าตั้งแต่ 0 ถึง 1 ยิ่งค่าสัมประสิทธิ์เข้าใกล้ 1 มากเท่าใด การพึ่งพาอาศัยกันก็จะยิ่งมากขึ้นเท่านั้น เมื่อประเมินแบบจำลองการถดถอย สิ่งนี้จะถูกตีความว่าแบบจำลองเหมาะสมกับข้อมูล สำหรับแบบจำลองที่ยอมรับได้ จะถือว่าค่าสัมประสิทธิ์การกำหนดต้องมีอย่างน้อย 50% (ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณเกิน 70% ในรูปค่าสัมบูรณ์) โมเดลที่มีค่าสัมประสิทธิ์การกำหนดสูงกว่า 80% ถือว่าค่อนข้างดี (ค่าสัมประสิทธิ์สหสัมพันธ์เกิน 90%) ค่าสัมประสิทธิ์การกำหนด 1 หมายถึงความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปร

2. ในกรณีที่ไม่มีความสัมพันธ์ทางสถิติระหว่างตัวแปรที่อธิบายกับปัจจัย สถิติสำหรับการถดถอยเชิงเส้นจะมีการแจกแจงเชิงเส้นกำกับ โดยที่ คือจำนวนปัจจัยในแบบจำลอง (ดูการทดสอบตัวคูณลากรองจ์) ในกรณีของการถดถอยเชิงเส้นที่มีข้อผิดพลาดแบบสุ่มแบบกระจายตามปกติ สถิติจะมีการกระจายแบบฟิชเชอร์ที่แน่นอน (สำหรับตัวอย่างทุกขนาด) (ดูการทดสอบ F) ข้อมูลเกี่ยวกับการกระจายของค่าเหล่านี้ทำให้คุณสามารถทดสอบนัยสำคัญทางสถิติได้ แบบจำลองการถดถอยขึ้นอยู่กับค่าสัมประสิทธิ์การตัดสินใจ ที่จริงแล้ว การทดสอบเหล่านี้ทดสอบสมมติฐานที่ว่าค่าสัมประสิทธิ์การตัดสินใจที่แท้จริงเท่ากับศูนย์

ข้อเสียและตัวบ่งชี้ทางเลือก

ปัญหาหลักของแอปพลิเคชัน (แบบเลือกสรร) คือมูลค่าของมันเพิ่มขึ้น ( ไม่ลดลง) จากการเพิ่มตัวแปรใหม่ให้กับโมเดล แม้ว่าตัวแปรเหล่านี้จะไม่เกี่ยวข้องกับตัวแปรที่กำลังอธิบายก็ตาม! ดังนั้นการเปรียบเทียบแบบจำลองกับปัจจัยจำนวนต่างกันโดยใช้สัมประสิทธิ์การกำหนดจึงถือว่าไม่ถูกต้อง ตัวบ่งชี้ทางเลือกสามารถใช้เพื่อวัตถุประสงค์เหล่านี้ได้

ปรับแล้ว

เพื่อที่จะสามารถเปรียบเทียบรุ่นต่างๆได้ด้วย ตัวเลขที่แตกต่างกันปัจจัยเพื่อให้จำนวนตัวถดถอย (ปัจจัย) ไม่ส่งผลกระทบต่อสถิติมักใช้ ปรับค่าสัมประสิทธิ์การตัดสินใจซึ่งใช้การประมาณค่าความแปรปรวนที่เป็นกลาง:

ซึ่งให้โทษสำหรับปัจจัยที่รวมเพิ่มเติมโดยที่ nคือจำนวนการสังเกต และ k คือจำนวนพารามิเตอร์

ตัวบ่งชี้นี้จะน้อยกว่าหนึ่งเสมอ แต่ในทางทฤษฎีแล้วสามารถทำได้ น้อยกว่าศูนย์(เฉพาะค่าที่น้อยมากของค่าสัมประสิทธิ์การกำหนดปกติและ ปริมาณมากปัจจัย) ดังนั้นการตีความตัวบ่งชี้ว่าเป็น "ส่วนแบ่ง" จึงสูญหายไป อย่างไรก็ตาม การใช้ตัวบ่งชี้ในการเปรียบเทียบนั้นค่อนข้างสมเหตุสมผล

สำหรับรุ่นที่มีตัวแปรตามเดียวกันและขนาดตัวอย่างเท่ากัน การเปรียบเทียบแบบจำลองโดยใช้ค่าสัมประสิทธิ์การกำหนดที่ปรับแล้วจะเทียบเท่ากับการเปรียบเทียบโดยใช้ ความแปรปรวนที่เหลือหรือข้อผิดพลาดมาตรฐานของแบบจำลอง ข้อแตกต่างเพียงอย่างเดียวคือเกณฑ์หลังจะเล็กลงก็ยิ่งดีเท่านั้น

เกณฑ์ข้อมูล

เอไอซี- เกณฑ์ข้อมูล Akaike - ใช้สำหรับการเปรียบเทียบรุ่นเท่านั้น ค่ายิ่งต่ำยิ่งดี มักใช้เพื่อเปรียบเทียบแบบจำลองอนุกรมเวลากับจำนวนความล่าช้าที่แตกต่างกัน
, ที่ไหน เค- จำนวนพารามิเตอร์รุ่น
บีไอซีหรือ เอส.ซี.- เกณฑ์ข้อมูล Bayesian Schwartz - ใช้และตีความคล้ายกับ AIC
- ให้โทษที่ใหญ่กว่าสำหรับการรวมความล่าช้าเพิ่มเติมในโมเดลมากกว่า AIC

- ทั่วไป (ขยาย)

ในกรณีที่ไม่มีค่าคงที่ในการถดถอยพหุคูณ OLS เชิงเส้น คุณสมบัติของสัมประสิทธิ์การกำหนดอาจถูกละเมิดสำหรับการใช้งานเฉพาะ ดังนั้น แบบจำลองการถดถอยที่มีและไม่มีจุดตัดกันจึงไม่สามารถเปรียบเทียบโดยใช้เกณฑ์ได้ ปัญหานี้แก้ไขได้ด้วยการสร้างสัมประสิทธิ์การกำหนดทั่วไป ซึ่งสอดคล้องกับค่าเดิมสำหรับกรณีของการถดถอย OLS ด้วยเงื่อนไขอิสระ และเป็นไปตามคุณสมบัติทั้งสี่ที่ระบุไว้ข้างต้น สาระสำคัญของวิธีนี้คือการพิจารณาการฉายภาพเวกเตอร์หน่วยบนระนาบของตัวแปรอธิบาย

สำหรับกรณีของการถดถอยโดยไม่มีคำจำลอง:
,
โดยที่ X คือเมทริกซ์ nxk ของค่าแฟกเตอร์ คือโปรเจ็กเตอร์บนระนาบ X โดยที่ คือเวกเตอร์หน่วย nx1

มีการปรับเปลี่ยนเล็กน้อยยังเหมาะสำหรับการเปรียบเทียบการถดถอยที่สร้างโดยใช้: OLS, กำลังสองน้อยที่สุดทั่วไป (GLM), กำลังสองน้อยที่สุดแบบมีเงื่อนไข (CMLS), กำลังสองน้อยสุดแบบมีเงื่อนไขทั่วไป (GCM)

ความคิดเห็น

โดยทั่วไปค่าสัมประสิทธิ์การกำหนดที่สูงไม่ได้บ่งชี้ถึงความสัมพันธ์ระหว่างเหตุและผลระหว่างตัวแปร (เช่นเดียวกับกรณีที่มีค่าสัมประสิทธิ์สหสัมพันธ์ตามปกติ) ตัวอย่างเช่น หากตัวแปรที่อธิบายและปัจจัยที่ไม่เกี่ยวข้องกับตัวแปรที่อธิบายจริง ๆ มีไดนามิกเพิ่มขึ้น ค่าสัมประสิทธิ์การกำหนดจะค่อนข้างสูง ดังนั้นความเพียงพอเชิงตรรกะและความหมายของแบบจำลองจึงมีความสำคัญยิ่ง นอกจากนี้ยังจำเป็นต้องใช้เกณฑ์ในการวิเคราะห์คุณภาพของแบบจำลองอย่างครอบคลุม

ดูเพิ่มเติม

หมายเหตุ

ลิงค์

  • เศรษฐมิติประยุกต์ (วารสาร)

มูลนิธิวิกิมีเดีย

  • 2010.
  • สัมประสิทธิ์เดอริติส

ปัจจัยแสงธรรมชาติ

    ดูว่า "ค่าสัมประสิทธิ์การตัดสินใจ" ในพจนานุกรมอื่น ๆ คืออะไร:ค่าสัมประสิทธิ์การกำหนด - การประเมินคุณภาพ (กำลังอธิบาย) ของสมการการถดถอย ส่วนแบ่งของความแปรปรวนในตัวแปรตามที่ถูกอธิบาย y: R2= 1 ผลรวม(yi yzi)2 / ผลรวม(yi y)2 โดยที่ yi คือค่าที่สังเกตได้ของ ตัวแปรตาม y, yzi คือค่าของตัวแปรตาม,... ...

    ค่าสัมประสิทธิ์การตัดสินใจสังคมวิทยา: สารานุกรม - กำลังสองของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นแบบเพียร์สัน ซึ่งแปลเป็นสัดส่วนของความแปรปรวนในตัวแปรตามซึ่งอธิบายโดยตัวแปรอิสระ...

    ค่าสัมประสิทธิ์การตัดสินใจพจนานุกรมสังคมวิทยา สังคม - การวัดว่าตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันในการวิเคราะห์การถดถอยได้ดีเพียงใด ตัวอย่างเช่น เปอร์เซ็นต์ของการเปลี่ยนแปลงในผลตอบแทนของสินทรัพย์ซึ่งอธิบายได้จากผลตอบแทนของพอร์ตโฟลิโอของตลาด...

    ค่าสัมประสิทธิ์การตัดสินใจพจนานุกรมการลงทุน - (ค่าสัมประสิทธิ์การกำหนด) ถูกกำหนดเมื่อสร้างความสัมพันธ์การถดถอยเชิงเส้น เท่ากับสัดส่วนของความแปรปรวนในตัวแปรตามที่เกี่ยวข้องกับการเปลี่ยนแปลงของตัวแปรอิสระ...

    อภิธานศัพท์ทางการเงิน- (ค่าสัมประสิทธิ์สหสัมพันธ์) ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว คำจำกัดความของค่าสัมประสิทธิ์สหสัมพันธ์ ประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของค่าสัมประสิทธิ์สหสัมพันธ์ การคำนวณ และการประยุกต์... ... สารานุกรมนักลงทุน

ค่าสัมประสิทธิ์การตัดสินใจ  

การวิเคราะห์ดำเนินการโดยใช้ค่าสัมประสิทธิ์การกำหนด  

อีกทางเลือกหนึ่งของการวัดระดับการพึ่งพาระหว่างตัวแปรสองตัวคือค่าสัมประสิทธิ์การกำหนด ซึ่งก็คือค่าสัมประสิทธิ์สหสัมพันธ์กำลังสอง (r2) ค่าสัมประสิทธิ์การกำหนดจะแสดงเป็นเปอร์เซ็นต์และสะท้อนถึงจำนวนการเปลี่ยนแปลงในตัวบ่งชี้ประสิทธิผล (y) เนื่องจากการเปลี่ยนแปลงในตัวแปรอื่น - ตัวบ่งชี้ปัจจัย (x)  

ตามผลลัพธ์ของตัวอย่างข้างต้น ค่าสัมประสิทธิ์การกำหนดคือ r = 0.471 b2 = 0.2224 = 22.24% ซึ่งหมายความว่าการเปลี่ยนแปลงรายได้จากการขายมากกว่า 22% เกิดจากการเปลี่ยนแปลงต้นทุนการโฆษณา  

กำหนดค่าสัมประสิทธิ์การกำหนดตามเงื่อนไขการทดสอบ 1. ตีความระดับของสัมประสิทธิ์นี้  

ในกรณีที่เป็นการยากที่จะปรับรูปแบบของการพึ่งพาอาศัยกัน การแก้ปัญหาสามารถทำได้โดยใช้แบบจำลองที่แตกต่างกัน และสามารถเปรียบเทียบผลลัพธ์ที่ได้รับได้ ความเพียงพอของแบบจำลองที่แตกต่างกันกับการขึ้นต่อกันจริงได้รับการตรวจสอบโดยใช้เกณฑ์ฟิชเชอร์ ค่าคลาดเคลื่อนโดยเฉลี่ยของการประมาณ และค่าของสัมประสิทธิ์พหุคูณของการกำหนด ซึ่งจะกล่าวถึงในภายหลัง (ดู 7.4)  

ค่าสัมประสิทธิ์การกำหนดแบบจำลองเท่ากับกำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณที่ลดลงคือ 99.31% ข้อผิดพลาดมาตรฐานของแบบจำลองเท่ากับ 4,415,000 รูเบิล / สถิติฟิชเชอร์ - 4.415 และระดับนัยสำคัญของสมมติฐานเกี่ยวกับ การขาดการเชื่อมต่อน้อยกว่า 0.01%  

นิพจน์นี้สอดคล้องกับนิพจน์ m)2 (ดูสูตร (8.2)) เอกลักษณ์ของสัมประสิทธิ์การกำหนดและกำลังสองของความสัมพันธ์สหสัมพันธ์ทำหน้าที่เป็นพื้นฐานสำหรับการตีความค่า r2l เป็นสัดส่วนของความแปรปรวนรวมของลักษณะผลลัพธ์ y ซึ่งอธิบายได้โดยการแปรผันของปัจจัย - ปัจจัย x (และ ความเชื่อมโยงระหว่างความแปรผันของลักษณะทั้งสอง) ตามความเป็นจริงแล้ว ตัวบ่งชี้หลักของความใกล้ชิดของการเชื่อมต่อ ควรพิจารณาถึงค่าสัมประสิทธิ์การตัดสินใจ  

ค่าสัมประสิทธิ์การกำหนด r2 = 71.3% เช่น ความแปรผันของอายุของคู่สมรสขึ้นอยู่กับ 71% ของการแปรผันของอายุของอีกครึ่งหนึ่ง การเชื่อมต่ออยู่ใกล้มาก  

เนื่องจาก r 2 เป็นอะนาล็อกของค่าสัมประสิทธิ์การกำหนด เราสามารถสรุปได้ว่า 42.2% ของการเปลี่ยนแปลงของต้นทุนนมในจำนวนทั้งสิ้นของ 136 องค์กรมีความเกี่ยวข้องกับการเปลี่ยนแปลงของผลผลิตโค (และด้วยปัจจัยที่แตกต่างกันไปพร้อมกับผลผลิตตาม โดยมีการจองไว้ก่อนหน้านี้เกี่ยวกับการตีความความสัมพันธ์แบบคู่)  

โดยที่ Ry2 คือสัมประสิทธิ์การกำหนดสมการที่มีตัวประกอบ k ทั้งหมด ตัวเศษ (8.43) คือส่วนที่อธิบายเพิ่มเติมของการแปรผันของ y เมื่อรวมตัวประกอบ xm ไว้ในสมการหลังจากตัวประกอบอื่นๆ ทั้งหมด ในตัวอย่างของเรา โดยใช้ค่าที่คำนวณไว้ก่อนหน้านี้ R2 = 0.5765 เมื่อรวมปัจจัย x3 ในการวิเคราะห์ เราจะได้  

อย่างไรก็ตามข้อเสียเปรียบที่ใหญ่ที่สุดของวิธีการสลาย R2 นี้คือการขึ้นอยู่กับค่า p2 ตามลำดับที่ยอมรับของการรวมปัจจัยในสมการการถดถอย ปัจจัยแรกที่รวมอยู่นั้นจะนำส่วนแบ่งส่วนใหญ่ของผลกระทบของระบบมาสนับสนุน และส่วนที่ไม่มีนัยสำคัญยังคงเป็นส่วนแบ่งของปัจจัยสุดท้าย ตัวอย่างเช่น ถ้าเราจัดเรียงปัจจัย dc และ xe ใหม่ และคำนวณค่าสัมประสิทธิ์การกำหนดแบบสองปัจจัย /Z2 x = 0.8035 โดยใช้สูตรที่เกิดซ้ำ เราจะได้ผลลัพธ์ที่แตกต่างจากครั้งก่อน  

ปัจจัยสัญญาณต้องมีความสัมพันธ์เชิงสาเหตุกับสัญญาณผลลัพธ์ (ผลที่ตามมา) ดังนั้นจึงเป็นที่ยอมรับไม่ได้ที่จะแนะนำค่าสัมประสิทธิ์ความสามารถในการทำกำไรเป็นหนึ่งในปัจจัย Xj ในรูปแบบต้นทุนแม้ว่าการรวมปัจจัยดังกล่าวจะเพิ่มค่าสัมประสิทธิ์การตัดสินใจอย่างมีนัยสำคัญ  

หลักการของความเรียบง่ายจะดีกว่าโมเดลที่มีปัจจัยจำนวนน้อยกว่าโดยมีค่าสัมประสิทธิ์การกำหนดเท่ากัน หรือแม้กระทั่งมีค่าสัมประสิทธิ์น้อยกว่าเล็กน้อย  

ค่าส่วนเกินที่เป็นไปได้สูงสุดคือหากไม่มีชุดค่าผสมที่ต่างกัน เช่น Ab และ Ba มันคือ 140 + 80 + 230 = 450 ตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อคืออัตราส่วนของส่วนเกินที่แท้จริงต่อส่วนเกินส่วนเพิ่ม 140 450 = 0.311 ดังที่เราเห็น ตัวบ่งชี้นี้ใกล้เคียงกับค่าสัมประสิทธิ์การเชื่อมโยง แต่มีการตีความที่สมเหตุสมผลและชัดเจนมาก การเชื่อมต่อคือ 0.311 หรือ 31.1% ของค่าการทำงานสูงสุดที่เป็นไปได้ ตัวบ่งชี้นี้ไม่ใช่อะนาล็อกของค่าสัมประสิทธิ์สหสัมพันธ์ แต่เป็นค่าสัมประสิทธิ์การกำหนด ดังนั้นจึงถูกต้องตามกฎหมายที่จะกำหนดให้เป็น R2 หรือ r 2 มันมีแบบฟอร์ม  

ค่าสัมประสิทธิ์การกำหนด r2 เท่ากับ 0.88 หรือ 88% ของความผันผวนของต้นทุนมันฝรั่งเกี่ยวข้องกับความผันผวนของผลผลิต ผลคูณของการเบี่ยงเบน mg yy เพียงสามรายการเท่านั้นที่เป็นค่าบวก และผลคูณที่เล็กที่สุดในนั้น  

การวิเคราะห์แบบหน่วยต่อหน่วยโดยใช้สมการการถดถอยมักจะขึ้นอยู่กับการแยกขนาดของส่วนเบี่ยงเบนจากค่าเฉลี่ยโดยรวม (y, - y) ออกเป็นสององค์ประกอบ (y, - y) และ (y, - y,) ถ้าสมการการถดถอยรวมปัจจัยที่สำคัญและมีนัยสำคัญทั้งหมดที่ค่าของคุณลักษณะผลลัพธ์ขึ้นอยู่กับ และค่าสัมประสิทธิ์การกำหนดใกล้เคียงกับเอกภาพ ปัจจัยที่เหลือที่ไม่รวมอยู่ในสมการจะแสดงลักษณะเฉพาะของคุณลักษณะที่ไม่สำคัญซึ่งมักไม่ มีการแสดงออกเชิงปริมาณ ในกรณีนี้ ความแตกต่าง (y, - y/) เกิดขึ้นเนื่องจากความแตกต่างระหว่างความรุนแรงของผลกระทบต่อ y ของปัจจัยทั้งหมดที่นำมาพิจารณาภายใต้เงื่อนไขของหน่วย i ที่กำหนดกับความรุนแรงเฉลี่ยของผลกระทบ แสดงในค่าของสัมประสิทธิ์การถดถอยที่รวมอยู่ใน ค่าที่คำนวณได้ปี สิ่งนี้ให้สิทธิ์ในการตีความความแตกต่าง (y, -y) หรืออัตราส่วน y/y เพื่อเป็นตัวบ่งชี้ว่าประสิทธิภาพของการใช้ปัจจัยที่นำมาพิจารณาในหน่วย y/-y มีความสัมพันธ์กับประสิทธิภาพโดยเฉลี่ยของการใช้งานอย่างไร ความแตกต่าง (y, - y) เกิดขึ้นเนื่องจากความแตกต่างในค่าของปัจจัยที่นำมาพิจารณาสำหรับหน่วย i ที่กำหนดและค่าเฉลี่ยสำหรับประชากร การสลายตัวนี้ทำให้สามารถระบุปริมาณสำรองที่มีอยู่สำหรับแต่ละหน่วยได้ในแง่ของประสิทธิภาพของปัจจัยการใช้และในแง่ของระดับ  

เมื่อพิจารณาค่าที่ค่อนข้างต่ำของค่าสัมประสิทธิ์การตัดสินใจที่รายงานและพื้นฐาน (/ 0 = 0.8] 54, r2, = 0.7974) ความแตกต่างระหว่างค่าจริงและค่าที่คำนวณได้ (V, - V) ไม่เพียงแสดงถึงความแตกต่างใน ประสิทธิภาพของการใช้ปัจจัยที่นำมาพิจารณา - ความหนาของอ่างเก็บน้ำ - ที่เหมืองแห่งนี้โดยเฉพาะเมื่อเปรียบเทียบกับประสิทธิภาพโดยเฉลี่ยสำหรับความไว้วางใจ แต่ยังรวมถึงอิทธิพลของปัจจัยที่ไม่ได้คำนึงถึงในสมการการถดถอยด้วย  

I วิธีที่สามในการสร้างส่วนแบ่งเฉลี่ยหลายมิติไม่จำเป็นต้องมีการประเมินโดยผู้เชี่ยวชาญเชิงอัตนัย - จะใช้เฉพาะข้อมูลที่มีอยู่ในการแบ่งปันดั้งเดิมเท่านั้น คุณลักษณะที่มีค่าสัมประสิทธิ์การตัดสินใจแชร์ที่สูงกว่าพร้อมคุณสมบัติที่เหลือทั้งหมดจะถือว่าให้ข้อมูลมากกว่าและมีความสำคัญมากกว่า เมื่อคำนวณค่าสัมประสิทธิ์การกำหนดแบบคู่และค่าเฉลี่ยแล้ว เราจะนำค่าที่น้อยกว่ามาเป็นหนึ่ง (หนึ่งจุด) และรับคะแนนสำหรับคุณลักษณะอื่น ๆ เป็นอัตราส่วนของค่าสัมประสิทธิ์การกำหนดโดยเฉลี่ยต่อค่าที่น้อยกว่า (ดูตาราง 11.9)  

หลังจากเลือกประเภทของสมการและคำนวณพารามิเตอร์แล้ว ควรตรวจสอบฟังก์ชันที่เลือกว่าเพียงพอหรือไม่ สาระสำคัญของขั้นตอนนี้คือฟังก์ชั่นที่เลือกนั้นมีลักษณะเฉพาะของการพัฒนาปรากฏการณ์ทางเศรษฐกิจที่อยู่ระหว่างการศึกษาหรือไม่และมีปัจจัยใด ๆ ในบรรดาปัจจัยที่สามารถแยกออกได้เนื่องจากไม่มีนัยสำคัญในการศึกษาปรากฏการณ์นี้ การศึกษานี้ใช้ค่าสัมประสิทธิ์การตัดสินใจและเกณฑ์ของฟิชเชอร์  

ค่าสัมประสิทธิ์การตัดสินใจ

คำพ้องความหมาย: สัมประสิทธิ์ผสม ความสัมพันธ์

สถิติที่สะท้อนถึงพลังการอธิบายของสมการ การถดถอยและเท่ากับอัตราส่วนของผลรวมของกำลังสองของการถดถอย SSR ต่อผลรวม รูปแบบต่างๆสวท:

โดยที่ระดับของซีรีย์คือค่าแบบจำลองคือค่าเฉลี่ยในทุกระดับของซีรีย์

ตัวบ่งชี้นี้เป็นการวัดทางสถิติของความดีที่เหมาะสม ซึ่งสามารถใช้เพื่อกำหนดว่าสมการการถดถอยเหมาะสมกับข้อมูลจริงได้ดีเพียงใด

ค่าสัมประสิทธิ์การกำหนดจะแตกต่างกันไปตั้งแต่ 0 ถึง 1 หากมีค่าเท่ากับ 0 แสดงว่าไม่มีความสัมพันธ์ระหว่างตัวแปรของแบบจำลองการถดถอย แต่แทนที่จะประเมินค่า ตัวแปรเอาท์พุตคุณสามารถใช้ค่าเฉลี่ยง่ายๆ ของค่าที่สังเกตได้ด้วยเช่นกัน ในทางตรงกันข้าม หากค่าสัมประสิทธิ์การกำหนดเป็น 1 สิ่งนี้จะสอดคล้องกับแบบจำลองในอุดมคติ เมื่อจุดสังเกตทั้งหมดอยู่ตรงกันทุกประการ เส้นถดถอย, เช่น. ผลรวมของกำลังสองของการเบี่ยงเบนคือ 0 ในทางปฏิบัติ หากค่าสัมประสิทธิ์การกำหนดใกล้กับ 1 แสดงว่าแบบจำลองทำงานได้ดีมาก (มีความสำคัญสูง) และหากเข้าใกล้ 0 นั่นหมายความว่า แบบจำลองมีความสำคัญต่ำเมื่อใด ตัวแปรอินพุต"อธิบาย" พฤติกรรมของวันหยุดได้ไม่ดีเช่น ไม่มีความสัมพันธ์เชิงเส้นระหว่างพวกเขา แน่นอนว่าโมเดลดังกล่าวจะมีประสิทธิภาพต่ำ

ค่าสัมประสิทธิ์การตัดสินใจ( 2 ) คือส่วนแบ่ง ความแตกต่างการเบี่ยงเบนของตัวแปรตามจากมัน ค่าเฉลี่ยอธิบายโดยการพิจารณา แบบอย่างการสื่อสาร(ตัวแปรอธิบาย) แบบจำลองความสัมพันธ์มักจะถูกระบุเป็นฟังก์ชันที่ชัดเจนของตัวแปรอธิบาย ในกรณีพิเศษของการเชื่อมต่อเชิงเส้น 2 เป็นสี่เหลี่ยมจัตุรัส ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอธิบาย

สูตรทั่วไปในการคำนวณค่าสัมประสิทธิ์การกำหนด:

ที่ไหน ฉันคือค่าที่สังเกตได้ของตัวแปรตาม และ ฉัน- ค่าของตัวแปรตามที่ทำนายโดยสมการถดถอย - ค่าเฉลี่ยเลขคณิตของตัวแปรตาม

เมื่อทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของการเชื่อมต่อ อาจไม่ทราบรูปแบบการเชื่อมต่อ จากนั้นระบุในรูปแบบของฟังก์ชันคงที่ทีละชิ้น (ในกรณีนี้ ค่าสัมประสิทธิ์การกำหนดจะเท่ากับกำลังสองของอัตราส่วนสหสัมพันธ์) หรือค่าที่ไม่รู้จักของฟังก์ชันการเชื่อมต่อถูกประมาณโดยใช้วิธีการ เรียบการพึ่งพาเชิงประจักษ์ (เช่น วิธีค่าเฉลี่ยเคลื่อนที่) .

สิ่งตีพิมพ์ในหัวข้อ