แบบจำลองการถดถอยพาราโบลา การวิเคราะห์สหสัมพันธ์และการถดถอยใน Excel: คำแนะนำในการดำเนินการ
การวิเคราะห์การถดถอยและสหสัมพันธ์ – วิธีการทางสถิติวิจัย. นี่เป็นวิธีทั่วไปในการแสดงการขึ้นต่อกันของพารามิเตอร์กับตัวแปรอิสระตั้งแต่หนึ่งตัวขึ้นไป
ด้านล่างโดยเฉพาะ ตัวอย่างการปฏิบัติเรามาดูการวิเคราะห์ทั้งสองที่ได้รับความนิยมมากในหมู่นักเศรษฐศาสตร์กันดีกว่า เราจะยกตัวอย่างการรับผลลัพธ์เมื่อรวมเข้าด้วยกัน
การวิเคราะห์การถดถอยใน Excel
แสดงอิทธิพลของค่าบางค่า (อิสระ, อิสระ) ต่อตัวแปรตาม ตัวอย่างเช่น จำนวนประชากรที่ทำงานเชิงเศรษฐกิจขึ้นอยู่กับจำนวนวิสาหกิจ ค่าจ้าง และพารามิเตอร์อื่นๆ อย่างไร หรือ: การลงทุนในต่างประเทศ ราคาพลังงาน ฯลฯ ส่งผลต่อระดับ GDP อย่างไร
ผลลัพธ์ของการวิเคราะห์ทำให้คุณสามารถเน้นลำดับความสำคัญได้ และขึ้นอยู่กับปัจจัยหลัก คาดการณ์ วางแผนการพัฒนาพื้นที่ที่มีความสำคัญ และตัดสินใจของฝ่ายบริหาร
การถดถอยเกิดขึ้น:
- เชิงเส้น (y = a + bx);
- พาราโบลา (y = a + bx + cx 2);
- เอ็กซ์โปเนนเชียล (y = a * exp(bx));
- กำลัง (y = a*x^b);
- ไฮเปอร์โบลิก (y = b/x + a);
- ลอการิทึม (y = b * 1n(x) + a);
- เอ็กซ์โปเนนเชียล (y = a * b^x)
มาดูตัวอย่างการสร้างแบบจำลองการถดถอยใน Excel และตีความผลลัพธ์ ลองใช้รูปแบบการถดถอยเชิงเส้นกัน
งาน. ที่ 6 องค์กร โดยเฉลี่ยต่อเดือน ค่าจ้างและจำนวนพนักงานที่ลาออก มีความจำเป็นต้องกำหนดการพึ่งพาจำนวนพนักงานที่ลาออกจากเงินเดือนโดยเฉลี่ย
โมเดลการถดถอยเชิงเส้นมีลักษณะดังนี้:
Y = a 0 + a 1 x 1 +…+akxk
โดยที่ a คือสัมประสิทธิ์การถดถอย x มีอิทธิพลต่อตัวแปร k คือจำนวนตัวประกอบ
ในตัวอย่างของเรา Y คือตัวบ่งชี้การลาออกจากพนักงาน ปัจจัยที่มีอิทธิพลคือค่าจ้าง (x)
Excel มีฟังก์ชันในตัวที่สามารถช่วยคุณคำนวณพารามิเตอร์ของตัวแบบการถดถอยเชิงเส้นได้ แต่ส่วนเสริม “แพ็คเกจการวิเคราะห์” จะดำเนินการได้เร็วกว่า
เราเปิดใช้งานเครื่องมือวิเคราะห์อันทรงพลัง:
เมื่อเปิดใช้งานแล้ว ส่วนเสริมจะพร้อมใช้งานในแท็บข้อมูล
ทีนี้มาวิเคราะห์การถดถอยกันดีกว่า
ก่อนอื่น เราสนใจเรื่อง R-squared และสัมประสิทธิ์
R-squared คือสัมประสิทธิ์การตัดสินใจ ในตัวอย่างของเรา – 0.755 หรือ 75.5% ซึ่งหมายความว่าพารามิเตอร์ที่คำนวณได้ของแบบจำลองจะอธิบายความสัมพันธ์ระหว่างพารามิเตอร์ที่ศึกษาได้ถึง 75.5% ยิ่งค่าสัมประสิทธิ์การตัดสินใจสูง โมเดลก็จะยิ่งดีขึ้น ดี - สูงกว่า 0.8 แย่ – น้อยกว่า 0.5 (การวิเคราะห์ดังกล่าวแทบจะไม่ถือว่าสมเหตุสมผล) ในตัวอย่างของเรา - “ไม่เลว”
ค่าสัมประสิทธิ์ 64.1428 แสดงให้เห็นว่า Y จะเป็นเท่าใดหากตัวแปรทั้งหมดในแบบจำลองที่กำลังพิจารณามีค่าเท่ากับ 0 กล่าวคือ ค่าของพารามิเตอร์ที่วิเคราะห์ยังได้รับอิทธิพลจากปัจจัยอื่นๆ ที่ไม่ได้อธิบายไว้ในแบบจำลองด้วย
ค่าสัมประสิทธิ์ -0.16285 แสดงน้ำหนักของตัวแปร X บน Y นั่นคือเงินเดือนเฉลี่ยต่อเดือนภายในแบบจำลองนี้ส่งผลต่อจำนวนผู้เลิกบุหรี่ที่มีน้ำหนัก -0.16285 (ซึ่งมีอิทธิพลเพียงเล็กน้อย) เครื่องหมาย “-” บ่งบอกถึงผลกระทบด้านลบ: มากกว่า เงินเดือนมากขึ้นยิ่งมีคนเลิกน้อยลง ซึ่งเป็นเรื่องยุติธรรม
การวิเคราะห์ความสัมพันธ์ใน Excel
การวิเคราะห์สหสัมพันธ์ช่วยพิจารณาว่ามีความสัมพันธ์ระหว่างตัวบ่งชี้ในหนึ่งหรือสองตัวอย่าง ตัวอย่างเช่น ระหว่างเวลาการทำงานของเครื่องจักรกับค่าซ่อม ราคาของอุปกรณ์และระยะเวลาการใช้งาน ส่วนสูงและน้ำหนักของเด็ก เป็นต้น
หากมีการเชื่อมต่อ การเพิ่มขึ้นของพารามิเตอร์ตัวหนึ่งจะนำไปสู่การเพิ่มขึ้น (ความสัมพันธ์เชิงบวก) หรือการลดลง (เชิงลบ) ของอีกพารามิเตอร์หนึ่ง การวิเคราะห์สหสัมพันธ์ช่วยให้นักวิเคราะห์พิจารณาว่าสามารถใช้ค่าของตัวบ่งชี้ตัวใดตัวหนึ่งในการทำนายได้หรือไม่ ความหมายที่เป็นไปได้อื่น.
ค่าสัมประสิทธิ์สหสัมพันธ์แสดงโดย r แตกต่างกันไปตั้งแต่ +1 ถึง -1 การจำแนกความสัมพันธ์สำหรับ พื้นที่ที่แตกต่างกันจะแตกต่างออกไป เมื่อสัมประสิทธิ์เป็น 0 การพึ่งพาเชิงเส้นไม่มีอยู่ระหว่างตัวอย่าง
มาดูวิธีการหาค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้ Excel
หากต้องการค้นหาค่าสัมประสิทธิ์ที่จับคู่ จะใช้ฟังก์ชัน CORREL
วัตถุประสงค์: พิจารณาว่ามีความสัมพันธ์ระหว่างเวลาปฏิบัติงานหรือไม่ กลึงและค่าบำรุงรักษา
วางเคอร์เซอร์ในเซลล์ใดก็ได้แล้วกดปุ่ม fx
- ในหมวดหมู่ "สถิติ" ให้เลือกฟังก์ชัน CORREL
- อาร์กิวเมนต์ “อาร์เรย์ 1” - ช่วงแรกของค่า – เวลาการทำงานของเครื่อง: A2:A14
- อาร์กิวเมนต์ "อาร์เรย์ 2" - ค่าช่วงที่สอง – ค่าซ่อม: B2:B14 คลิกตกลง
คุณต้องพิจารณาประเภทการเชื่อมต่อเพื่อกำหนดประเภทการเชื่อมต่อ จำนวนสัมบูรณ์ค่าสัมประสิทธิ์ (แต่ละกิจกรรมมีขนาดของตัวเอง)
สำหรับ การวิเคราะห์ความสัมพันธ์พารามิเตอร์หลายตัว (มากกว่า 2 ตัว) สะดวกกว่าในการใช้ "การวิเคราะห์ข้อมูล" (โปรแกรมเสริม "แพ็คเกจการวิเคราะห์") คุณต้องเลือกความสัมพันธ์จากรายการและกำหนดอาร์เรย์ ทั้งหมด.
ค่าสัมประสิทธิ์ผลลัพธ์จะแสดงในเมทริกซ์สหสัมพันธ์ แบบนี้:
การวิเคราะห์สหสัมพันธ์และการถดถอย
ในทางปฏิบัติทั้งสองเทคนิคนี้มักใช้ร่วมกัน
ตัวอย่าง:
ขณะนี้ข้อมูลการวิเคราะห์การถดถอยปรากฏให้เห็นแล้ว
การพึ่งพาพาราโบลามีรูปแบบ:
ผลลัพธ์ของการคำนวณเสริมสำหรับการสร้างแบบจำลองการถดถอยพาราโบลาและคุณลักษณะของคุณภาพของแบบจำลองแสดงไว้ในตารางที่ 5
ตารางที่ 5.
ข้อมูลการคำนวณ
ค่าเฉลี่ย |
||||||||||
ผลรวมของกำลังสอง |
||||||||||
1. กำหนดพารามิเตอร์ a, b, c ของแบบจำลองพาราโบลา
ดังนั้นการพึ่งพาต้นทุนการหล่อ 1 ตัน y (rub.) กับข้อบกพร่องในการหล่อ x (t) สำหรับโรงหล่อ 10 แห่งสามารถแสดงเป็นการพึ่งพาพาราโบลา:
2. มาตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอยโดยใช้แบบทดสอบของนักเรียนกันดีกว่า
เช่นเดียวกับในกรณีของการถดถอยแบบคู่ ความสำคัญของสัมประสิทธิ์ของการถดถอยเชิงเส้นพหุคูณกับตัวแปรอธิบาย m จะถูกทดสอบโดยใช้สถิติ t
ส่วนเบี่ยงเบนมาตรฐาน
ข้อผิดพลาดมาตรฐานของการถดถอย m - จำนวนตัวแปรอธิบายของแบบจำลอง
เรามาสร้างเมทริกซ์กันดีกว่า
เรามาพิจารณาผลคูณของเมทริกซ์ทั้งสองที่สร้างขึ้นด้านบน (ใน Excel โดยใช้ฟังก์ชัน "MULTIPLE"):
พิจารณาข้อผิดพลาดมาตรฐานของการถดถอยโดยใช้สูตร:
เรามากำหนดกัน ส่วนเบี่ยงเบนมาตรฐานตามสูตร:
เรามากำหนดกัน ค่าที่คำนวณได้สำหรับค่าสัมประสิทธิ์การถดถอยพหุคูณ:
โดยใช้ตารางการแจกแจงนักเรียน เรากำหนดว่า:
|tcalc|< tтеор, следовательно, коэффициенты а, с и b незначимы при уровне значимости 0,05.
3. ให้เราค้นหาความสัมพันธ์สหสัมพันธ์ ซึ่งในกรณีของการพึ่งพาแบบไม่เชิงเส้น ความใกล้ชิดของความสัมพันธ์ระหว่างสอง ตัวแปรสุ่ม x และ y
ค่าของอัตราส่วนสหสัมพันธ์ค่อนข้างใกล้เคียงกับ 1 ซึ่งบ่งบอกถึงความสัมพันธ์ที่แข็งแกร่งระหว่าง x และ y เช่น ระหว่างต้นทุนการหล่อ 1 ตัน (y) ในรูเบิล และข้อบกพร่องในการหล่อ (x) รวม
4. กำหนดความสัมพันธ์อัตโนมัติของสารตกค้างโดยใช้เกณฑ์ Durbin-Watson
ให้เรากำหนดค่าของเกณฑ์ d โดยใช้สูตร:
แทนที่ผลลัพธ์ของการคำนวณเบื้องต้น (ดูตารางที่ 5) ลงในสูตร:
เมื่อใช้ตาราง Durbin-Watson เรากำหนดขอบเขตวิกฤติ d1 และ d2 ที่ N = 10 และ m = 2:
ด1 =0.697; ด2 = 1.641
ง2 5. กำหนดความคลาดเคลื่อนการประมาณสัมพัทธ์โดยเฉลี่ยเป็นเปอร์เซ็นต์ แทนที่ผลลัพธ์ของการคำนวณเบื้องต้น (ดูตารางที่ 5) ลงในสูตร: , > 8-10% ดังนั้นแบบจำลองจึงไม่เป็นที่ยอมรับสำหรับการคาดการณ์ ซึ่งสามารถอธิบายได้ด้วยการสังเกตจำนวนน้อย (N=10) เพื่อให้แบบจำลองใช้ในการพยากรณ์ก็เพียงพอแล้วที่จะเพิ่มจำนวนการสังเกตจาก 10 เป็น 15 จากนั้น<10 %. ข้อสรุปเกี่ยวกับแบบจำลอง: ไม่มีความสัมพันธ์อัตโนมัติของส่วนที่เหลือ ความสัมพันธ์มีความแข็งแกร่ง แต่ค่าสัมประสิทธิ์ไม่มีนัยสำคัญ และแบบจำลองไม่สามารถยอมรับได้สำหรับการคาดการณ์ ดังนั้นแบบจำลองจึงไม่สามารถสะท้อนความสัมพันธ์ระหว่างต้นทุนการหล่อ Y (rub.) 1 ตันกับข้อบกพร่องในการหล่อ X (t) ได้เพียงพอ อาจจำเป็นต้องขยายรายการข้อสังเกตหรือพิจารณากลุ่มตัวอย่างที่แตกต่างจากประชากร ข้อมูลจำเพาะของรุ่น ในการเลือกความสัมพันธ์ที่สอดคล้องกับความสัมพันธ์ที่แท้จริงระหว่างต้นทุนการหล่อ Y (rub.) 1 ตันกับการหล่อ X (t) ที่มีข้อบกพร่องสำหรับโรงหล่อ 10 แห่ง จำเป็นต้องวิเคราะห์ข้อมูลที่นำเสนอโดยสรุป ตารางที่ 6. ตารางสรุปที่ 6 เชิงเส้น ไฮเปอร์โบลิก ลอการิทึม พลัง พาราโบลา พารามิเตอร์ที่ไม่รู้จักของสมการถดถอย ความใกล้ชิดของการเชื่อมต่อระหว่าง y และ x ความสำคัญของพารามิเตอร์สมการถดถอย (+ สำหรับนัยสำคัญเชิงเส้นของสัมประสิทธิ์สหสัมพันธ์) tcalc(rxy)=3.367 นัยสำคัญ tcalc(a)=4.618 นัยสำคัญ tcalc(b)=3.367 นัยสำคัญ tcalc(a)=11.968 นัยสำคัญ tcalc(b)=-2.685 มีนัยสำคัญ ทีแคลซี(ก)=3.75 tcalc(b)=3.429 นัยสำคัญ tcalc(a)=25.999 นัยสำคัญ tcalc(b)=3.071 นัยสำคัญ tcalc(a)=1.661 ไม่มีนัยสำคัญ tcalc(b)=1.505 ไม่มีนัยสำคัญ ทีแคลซี(c)= -0.833 ไม่มีนัยสำคัญ ข้อผิดพลาดในการประมาณสัมพัทธ์โดยเฉลี่ย, % ยอมรับไม่ได้ ยอมรับไม่ได้ ยอมรับไม่ได้ ยอมรับไม่ได้ ยอมรับไม่ได้ ค่าของเกณฑ์ความสัมพันธ์อัตโนมัติคงเหลือ ไม่มีความสัมพันธ์อัตโนมัติ ไม่มีความสัมพันธ์อัตโนมัติ ไม่มีความสัมพันธ์อัตโนมัติ ไม่มีความสัมพันธ์อัตโนมัติ ความสัมพันธ์อัตโนมัติ ไม่มา เมื่อระบุแบบจำลอง ขั้นแรกเราจะยกเว้นแบบจำลองที่มีความสัมพันธ์อัตโนมัติของส่วนที่เหลือและพารามิเตอร์การถดถอยไม่มีนัยสำคัญ ไม่มีความสัมพันธ์อัตโนมัติของสารตกค้างในทุกรุ่น พารามิเตอร์ของการถดถอยที่สร้างขึ้นทั้งหมด ยกเว้นพาราโบลา มีนัยสำคัญ ดังนั้น แบบจำลองพาราโบลาจึงไม่สามารถเป็นแบบจำลองที่สะท้อนความสัมพันธ์ระหว่าง x และ y ได้ดีที่สุด - เราไม่นำมาพิจารณาเพิ่มเติม จากนั้น จากการอ้างอิงที่เหลือ คุณต้องเลือกการขึ้นต่อกันที่มีอัตราส่วนสหสัมพันธ์หรือสัมประสิทธิ์สหสัมพันธ์ที่ใหญ่ที่สุด ในบรรดาแบบจำลองของเรา ความใกล้เคียงกันโดยประมาณของการเชื่อมต่อระหว่าง x และ y มีอยู่ในโมเดลเชิงเส้น (rxy = 0.776) และกำลัง () ในสถานการณ์เช่นนี้ จะให้ความสำคัญกับแบบจำลองที่มีข้อผิดพลาดในการประมาณน้อยกว่า แต่โมเดลเชิงเส้นก็เป็นข้อยกเว้นประเภทหนึ่ง เพราะว่า จะได้รับการตั้งค่าโดยไม่คำนึงถึงขนาดของข้อผิดพลาดในการประมาณ นอกจากนี้เป็นที่น่าสังเกตว่าในแบบจำลองเชิงเส้นและกำลังที่สร้างขึ้นค่าของข้อผิดพลาดในการประมาณค่อนข้างใกล้เคียงกัน (เชิงเส้น: ; กำลังไฟ :) ดังนั้น แม้ว่าแบบจำลองกฎกำลังจะสะท้อนความสัมพันธ์ระหว่าง x และ y ได้ค่อนข้างดี แต่เราให้ความสำคัญกับแบบจำลองเชิงเส้นมากกว่า ดังนั้น จากทุกรุ่น โมเดลเชิงเส้นตรงจะสะท้อนถึงความสัมพันธ์ในชีวิตจริงได้ดีที่สุดระหว่างต้นทุนการหล่อ Y (rub.) จำนวน 1 ตัน และการหล่อ X (t) ที่มีข้อบกพร่องในโรงหล่อ 10 แห่ง ไม่มีความสัมพันธ์อัตโนมัติของส่วนที่เหลือในแบบจำลองนี้ ค่าสัมประสิทธิ์มีนัยสำคัญ ความสัมพันธ์ระหว่าง x และ y มีความแข็งแกร่ง แต่โมเดลนี้ไม่สามารถยอมรับได้สำหรับการคาดการณ์ ในเวลาเดียวกันข้อผิดพลาดในการประมาณของแบบจำลองนี้ค่อนข้างใกล้กับค่าวิกฤต - 10% ดังนั้นเพื่อที่จะกำจัดข้อเสียเปรียบนี้และทำให้แบบจำลองเป็นที่ยอมรับสำหรับการคาดการณ์ก็เพียงพอแล้วที่จะเพิ่มข้อสังเกตหลายประการ งานห้องปฏิบัติการ การพยากรณ์กระบวนการทางเศรษฐกิจ ข้อกำหนดสำหรับเนื้อหา การออกแบบ และลำดับการดำเนินการ ในการทำงานในห้องปฏิบัติการ คุณต้องสร้างสมุดงาน Excel ใหม่ภายใต้ชื่อ “ชื่อของคุณ งานห้องปฏิบัติการหมายเลข 1 ตัวเลือกหมายเลข _” (ตัวอย่างเช่น: “งานห้องปฏิบัติการ Ivanov I.P. หมายเลข 1” ตัวเลือกหมายเลข 4) ก่อนปฏิบัติงานในห้องปฏิบัติการ ให้ศึกษาส่วนทางทฤษฎีและวิธีการปฏิบัติงานให้เสร็จสิ้น การมอบหมายจะต้องเสร็จสิ้นและเสร็จสิ้น ตามตัวเลือกของคุณ
- แผ่นงานในสมุดงานควรมีชื่อว่า Task1, Task2 ป้อนผลลัพธ์ของงานลงในไฟล์รายงาน ตัวเลือกสำหรับงานในห้องปฏิบัติการจะกระจายตามหมายเลขในรายการกลุ่ม ดูตาราง หลังจากเสร็จสิ้นแล็บแล้ว ให้ตอบคำถามทบทวน วางคำตอบของคำถามเพื่อความปลอดภัยไว้ในไฟล์รายงาน คุณต้องจัดเตรียมสมุดงานของคุณพร้อมกับไฟล์รายงานให้กับครูในฟล็อปปี้ดิสก์โดยลงนามใน "รายงานผลงานห้องปฏิบัติการหมายเลข 2 ของนักเรียน I.P. 170404". ส่วนทางทฤษฎี การพยากรณ์เป็นวิธีการวิจัยทางวิทยาศาสตร์ที่มีจุดมุ่งหมายเพื่อให้ทางเลือกที่เป็นไปได้สำหรับกระบวนการและปรากฏการณ์เหล่านั้นที่ได้รับเลือกให้เป็นหัวข้อของการวิเคราะห์ งาน การพยากรณ์เศรษฐกิจ
คือ คาดการณ์การกระจายทรัพยากรที่เป็นไปได้ในด้านต่างๆ การกำหนดขีดจำกัดล่างและบนของผลลัพธ์ที่ได้รับ การประเมินจำนวนทรัพยากรที่เป็นไปได้สูงสุดที่จำเป็นในการแก้ปัญหาทางเศรษฐกิจ วิทยาศาสตร์ และทางเทคนิค ฯลฯ ขึ้นอยู่กับช่วงเวลาที่ทำการคาดการณ์ (ช่วงนำ) การคาดการณ์สามารถ: · ระยะสั้น; · ระยะกลาง; · ระยะยาว; · ระยะยาว. การไล่ระดับการคาดการณ์ชั่วคราวจะสัมพันธ์กันและขึ้นอยู่กับลักษณะและวัตถุประสงค์ของการพยากรณ์ เพื่อดำเนินการ การคาดการณ์ระยะสั้น
วิธีที่ใช้กันมากที่สุดคือการประมาณค่า วิธีการอนุมานประกอบด้วยการค้นหาค่าที่อยู่นอกขอบเขตของชุดข้อมูลทางสถิติที่กำหนด: ขึ้นอยู่กับค่าที่ทราบของชุดข้อมูลทางสถิติจะพบค่าอื่นที่อยู่นอกชุดข้อมูลนี้ เมื่อคาดการณ์ข้อสรุปจากการศึกษาแนวโน้มการพัฒนาปรากฏการณ์ในอดีตและปัจจุบันจะถูกถ่ายทอดไปยังอนาคต ได้แก่ การประมาณค่านี้ขึ้นอยู่กับสมมติฐานของความเสถียรบางประการของคุณลักษณะของปัจจัยที่มีอิทธิพลต่อการพัฒนาของปรากฏการณ์นี้ รูปที่ 1. การกำหนดพื้นฐานของวิธีการประมาณค่า เมื่อคาดการณ์ (ดูรูปที่ 1) จะใช้คำศัพท์ต่อไปนี้: เสื้อ 1 – ความลึกของการหวนกลับ; เสื้อ 2 – ช่วงเวลาแห่งการทำนาย; เสื้อ 3 – ขอบฟ้าพยากรณ์; เสื้อ 2 – เสื้อ 1 – ช่วงเวลาการสังเกต (ช่วงเวลาบนพื้นฐานของการศึกษาประวัติการพัฒนาของวัตถุพยากรณ์) t 3 – t 2 – ช่วงลีด (ช่วงเวลาที่การคาดการณ์ได้รับการพัฒนา) ยิ่งกระบวนการและแนวโน้มที่คาดการณ์ไว้มีเสถียรภาพมากขึ้นเท่าใด ขอบเขตการคาดการณ์ก็จะยิ่งสามารถถอยกลับไปได้มากเท่านั้น ตามที่แสดงในทางปฏิบัติ ช่วงเวลาการสังเกตควรนานกว่าช่วงเวลานำสามเท่าหรือมากกว่า ตามกฎแล้วช่วงเวลานี้ค่อนข้างสั้น วิธีการอนุมานใช้ไม่ได้กับกระบวนการที่ไม่ต่อเนื่อง วิธีการประมาณค่าสามารถนำไปใช้บนคอมพิวเตอร์ส่วนบุคคลได้อย่างง่ายดาย การใช้โปรเซสเซอร์สเปรดชีตสมัยใหม่ เช่น MS Excel ช่วยให้คุณสามารถคาดการณ์กระบวนการทางเศรษฐกิจได้อย่างรวดเร็วโดยใช้วิธีการคาดการณ์ เพื่อเพิ่มความแม่นยำของการพยากรณ์จำเป็นต้องคำนึงถึงการพึ่งพาค่าที่ทำนาย Y จากปัจจัยภายนอก X ตามกฎแล้วชุดของค่าที่กำลังศึกษาจะขึ้นอยู่กับอิทธิพลของปัจจัยสุ่ม ในเรื่องนี้ การพึ่งพาค่าที่คาดการณ์ Y จากปัจจัยภายนอก X ส่วนใหญ่มักเป็นค่าทางสถิติหรือสหสัมพันธ์ เชิงสถิติเรียกว่าการพึ่งพาตัวแปรสุ่มโดยแต่ละค่าของหนึ่งในนั้นสอดคล้องกับกฎการกระจายของอีกตัวแปรหนึ่ง กล่าวคือ การเปลี่ยนแปลงในตัวแปรตัวใดตัวหนึ่งทำให้เกิดการเปลี่ยนแปลงในการแจกแจงของอีกตัวหนึ่ง ความสัมพันธ์เรียกว่าการพึ่งพาทางสถิติของตัวแปรสุ่ม ซึ่งการเปลี่ยนแปลงในปริมาณหนึ่งจะทำให้เกิดการเปลี่ยนแปลงในค่าเฉลี่ยของอีกปริมาณหนึ่ง การวัดการพึ่งพาสหสัมพันธ์ของตัวแปรสุ่ม X และ Y สองตัวคือสัมประสิทธิ์สหสัมพันธ์ r ซึ่งเป็นปริมาณที่ไม่มีมิติ ดังนั้นจึงไม่ขึ้นอยู่กับการเลือกหน่วยการวัดของปริมาณที่ศึกษา คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์: 1) หากตัวแปรสุ่ม X และ Y สองตัวเป็นอิสระต่อกัน ค่าสัมประสิทธิ์สหสัมพันธ์จะเป็นศูนย์ กล่าวคือ ร=0. 2) โมดูลัสของสัมประสิทธิ์สหสัมพันธ์ไม่เกินเอกภาพนั่นคือ |r|£1 ซึ่งเทียบเท่ากับอสมการสองเท่า: -1£r£1 3) ความเท่าเทียมกันของค่าสัมประสิทธิ์ -1 หรือ +1 บ่งบอกถึงการมีอยู่ของการเชื่อมต่อการทำงาน (โดยตรง) เครื่องหมาย "+" บ่งบอกถึงความสัมพันธ์โดยตรง (การเพิ่มขึ้นหรือลดลงในคุณลักษณะหนึ่งจะมาพร้อมกับการเปลี่ยนแปลงที่คล้ายกันในคุณลักษณะอื่น) เครื่องหมาย "-" บ่งบอกถึงความสัมพันธ์แบบย้อนกลับ (การเพิ่มขึ้นหรือลดลงในคุณลักษณะหนึ่งจะมาพร้อมกับการเปลี่ยนแปลง ในคุณลักษณะอื่นในทิศทางตรงกันข้าม) หลังจากพิจารณาคุณลักษณะปัจจัยที่สำคัญที่สุดที่มีอิทธิพลต่อค่าที่คาดการณ์ไว้แล้ว การสร้างคำอธิบายทางคณิตศาสตร์ (สมการ) ก็มีความสำคัญไม่แพ้กัน ซึ่งทำให้สามารถประเมินตัวบ่งชี้ประสิทธิภาพเชิงตัวเลขผ่านคุณลักษณะของปัจจัยได้ สมการที่แสดงการเปลี่ยนแปลงในค่าเฉลี่ยของตัวบ่งชี้ประสิทธิภาพขึ้นอยู่กับค่าของคุณลักษณะของปัจจัยที่เรียกว่า สมการถดถอย.
เส้นบนระนาบพิกัดที่สอดคล้องกับสมการถดถอยเรียกว่า เส้นถดถอย
.
การพึ่งพาสหสัมพันธ์สามารถแสดงได้ด้วยสมการการถดถอยประเภทต่างๆ เช่น เชิงเส้น พาราโบลา ไฮเปอร์โบลิก เลขชี้กำลัง ฯลฯ การถดถอยเชิงเส้น สมการการถดถอยเชิงเส้น(เลือก) ยบน เอ็กซ์เรียกว่าการพึ่งพาค่าที่สังเกตได้จากปริมาณ เอ็กซ์แสดงด้วยฟังก์ชันเชิงเส้น: ค่าอยู่ที่ไหน รเรียกว่า ค่าสัมประสิทธิ์การถดถอยเชิงเส้น Yบน เอ็กซ์ ข- คงที่. การประมาณเชิงเส้นอธิบายการเปลี่ยนแปลงของปริมาณที่เกิดขึ้นในอัตราคงที่ได้เป็นอย่างดี ถ้าสัมประสิทธิ์สหสัมพันธ์ของสองปริมาณ เอ็กซ์และ ยเท่ากับ ร=±1 ดังนั้นปริมาณเหล่านี้สัมพันธ์กันด้วยความสัมพันธ์เชิงเส้น ค่าสัมประสิทธิ์สหสัมพันธ์ทำหน้าที่เป็นตัววัดความแข็งแกร่ง (ความใกล้ชิด) ของการพึ่งพาเชิงเส้นของปริมาณที่วัดได้ ในทางปฏิบัติถ้าค่าสัมประสิทธิ์สหสัมพันธ์ของสองปริมาณ เอ็กซ์และ ใช่ | อาร์|>0.5 จากนั้นพวกเขาเชื่อว่ามีเหตุผลที่จะถือว่ามีความสัมพันธ์เชิงเส้นระหว่างปริมาณเหล่านี้ อย่างไรก็ตาม จะเป็นการดีกว่าที่จะนำทางเมื่อเลือกประเภทของเส้นการถดถอย (เชิงเส้นหรือไม่เชิงเส้น) ตามประเภทของการพึ่งพาเชิงประจักษ์ของปริมาณ เอ็กซ์และ ย. การถดถอยพาราโบลาและพหุนาม พาราโบลาการพึ่งพาอาศัยกันของมูลค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาซึ่งแสดงโดยฟังก์ชันกำลังสอง (พาราโบลาลำดับที่ 2): . (2) สมการนี้เรียกว่า สมการถดถอยพาราโบลา Yบน เอ็กซ์- ตัวเลือก ก, ข, กับถูกเรียกว่า สัมประสิทธิ์การถดถอยพาราโบลา- การคำนวณสัมประสิทธิ์การถดถอยพาราโบลานั้นยุ่งยากเสมอ ดังนั้นจึงแนะนำให้ใช้คอมพิวเตอร์ในการคำนวณ สมการ (2) ของการถดถอยพาราโบลาเป็นกรณีพิเศษของการถดถอยทั่วไปที่เรียกว่าการถดถอยพหุนาม พหุนามการพึ่งพาอาศัยกันของมูลค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาซึ่งแสดงโดยพหุนาม n-ลำดับที่: ตัวเลขอยู่ที่ไหน และฉัน (ฉัน=0,1,…, n) ถูกเรียก สัมประสิทธิ์การถดถอยพหุนาม. การประมาณพหุนามใช้เพื่ออธิบายปริมาณที่เพิ่มขึ้นและลดสลับกัน มีประโยชน์สำหรับการวิเคราะห์ชุดข้อมูลขนาดใหญ่เกี่ยวกับปริมาณที่ไม่เสถียร เป็นต้น การถดถอยพลังงาน พลังการพึ่งพาอาศัยกันของมูลค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาแบบฟอร์ม: สมการนี้เรียกว่า สมการถดถอยกำลัง Yบน เอ็กซ์- ตัวเลือก กและ ขถูกเรียกว่า ค่าสัมประสิทธิ์การถดถอยกำลัง. การประมาณกฎกำลังมีประโยชน์ในการอธิบายปริมาณที่เพิ่มขึ้นหรือลดลงอย่างซ้ำซากจำเจ เช่น ระยะทางที่รถเคลื่อนที่ด้วยความเร่ง การประมาณกฎกำลังไม่สามารถนำมาใช้ได้หากข้อมูลมีค่าเป็นศูนย์หรือค่าลบ การถดถอยเอ็กซ์โปเนนเชียล บ่งชี้(หรือ เอ็กซ์โปเนนเชียล) การพึ่งพาอาศัยกันของค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาแบบฟอร์ม: สมการนี้เรียกว่า สมการเลขชี้กำลัง(หรือ เอ็กซ์โปเนนเชียล) การถดถอย Yบน เอ็กซ์- ตัวเลือก ก(หรือ เค) และ ขถูกเรียกว่า สัมประสิทธิ์เลขชี้กำลัง(หรือ เอ็กซ์โปเนนเชียล) การถดถอย. การประมาณเอ็กซ์โปเนนเชียลมีประโยชน์เมื่ออัตราการเปลี่ยนแปลงข้อมูลเพิ่มขึ้นอย่างต่อเนื่อง อย่างไรก็ตาม สำหรับข้อมูลที่มีค่าเป็นศูนย์หรือค่าลบ การประมาณประเภทนี้จะไม่สามารถใช้ได้ การถดถอยลอการิทึม ลอการิทึมการพึ่งพาอาศัยกันของมูลค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาแบบฟอร์ม: (6) สมการนี้เรียกว่า สมการการถดถอยลอการิทึม Yบน เอ็กซ์- ตัวเลือก กและ ขถูกเรียกว่า สัมประสิทธิ์การถดถอยลอการิทึม. การประมาณลอการิทึมมีประโยชน์ในการอธิบายปริมาณที่เพิ่มขึ้นหรือลดลงอย่างรวดเร็วในตอนแรก จากนั้นจึงค่อย ๆ คงที่ การประมาณลอการิทึมใช้ทั้งปริมาณที่เป็นลบและบวก การถดถอยแบบไฮเปอร์โบลิก ไฮเปอร์โบลิกการพึ่งพาอาศัยกันของมูลค่า ยจากขนาด เอ็กซ์เรียกว่าการพึ่งพาแบบฟอร์ม: สมการนี้เรียกว่า สมการการถดถอยไฮเปอร์โบลิก Yบน เอ็กซ์- ตัวเลือก กและ ขถูกเรียกว่า ค่าสัมประสิทธิ์การถดถอยไฮเปอร์โบลิก. คุณภาพของการสร้างสมการการถดถอยมีลักษณะโดยความคลาดเคลื่อนโดยเฉลี่ยของการประมาณหรือข้อผิดพลาดสัมพัทธ์ของการพยากรณ์: (8) โดยที่ Y e คือค่าเชิงประจักษ์ของตัวบ่งชี้ที่ทำนายไว้ Y – ค่าที่คำนวณได้ของตัวบ่งชี้ที่คาดการณ์ไว้ การดำเนินการวิเคราะห์การถดถอยสามารถแบ่งได้เป็น 3 ขั้นตอน ได้แก่ การเลือกรูปแบบของความสัมพันธ์ (ประเภทของสมการ) จากข้อมูลทางสถิติ การคำนวณค่าสัมประสิทธิ์ของสมการที่เลือก การประเมินความน่าเชื่อถือของสมการที่เลือก การใช้ตัวประมวลผลสเปรดชีตทำให้การวิเคราะห์การถดถอยทุกขั้นตอนเป็นเรื่องง่าย การถดถอยแบบปัจจัยเดียวอีกประเภทหนึ่งคือการประมาณด้วยพหุนามกำลังในรูปแบบ: เป็นเรื่องปกติที่เราต้องการได้รับการพึ่งพาที่ง่ายที่สุดเท่าที่จะเป็นไปได้ โดยจำกัดตัวเราเองให้เพิ่มกำลังพหุนามในระดับที่สอง เช่น การพึ่งพาพาราโบลา: ลองคำนวณอนุพันธ์ย่อยเทียบกับค่าสัมประสิทธิ์กัน ข 0
,
ข 1
และ ข 2
: เมื่อเทียบอนุพันธ์ให้เป็นศูนย์เราจะได้ระบบสมการปกติ: (5.5.4) การแก้ระบบสมการปกติ (5.5.2) สำหรับค่าเฉพาะกรณี x ฉัน *
,
ย ฉัน *
;
(5.5.5) รูปที่ 5.5.1 แสดงตัวอย่างทั่วไปของการประมาณโดยการพึ่งพาพาราโบลา: 9
(5;9)
(1;1)
1
1 2 3 4 5 x
รูปที่ 5.5.1 พิกัดจุดทดลองและค่าประมาณ การพึ่งพาพาราโบลา ตัวอย่างที่ 5.1ประมาณผลการทดลองที่กำหนดในตารางที่ 5.1.1 ด้วยสมการการถดถอยเชิงเส้น ตารางที่ 5.1.1 เรามาสร้างจุดทดลองตามพิกัดที่ระบุในตาราง 5.1.1 บนกราฟที่แสดงในรูปที่ 5.1.1 ที่ 9
4
1
2 3
4 5 x ตามรูปที่ 5.1.1 ซึ่งเราจะวาดเส้นตรงสำหรับการประเมินเบื้องต้น เราจะสรุปได้ว่าตำแหน่งของจุดทดลองมีความไม่เชิงเส้นที่แสดงออกมาอย่างชัดเจน แต่ก็ไม่มีนัยสำคัญมากนักดังนั้นจึงสมเหตุสมผล เพื่อประมาณพวกมันด้วยการพึ่งพาเชิงเส้น โปรดทราบว่าเพื่อให้ได้ข้อสรุปทางคณิตศาสตร์ที่ถูกต้อง จำเป็นต้องสร้างเส้นตรงโดยใช้วิธีกำลังสองน้อยที่สุด ก่อนทำการวิเคราะห์การถดถอย แนะนำให้คำนวณก่อน สัมประสิทธิ์สหสัมพันธ์เชิงเส้นระหว่างตัวแปร เอ็กซ์และ ที่: ความสำคัญของความสัมพันธ์สหสัมพันธ์ถูกกำหนดโดยค่าวิกฤตของสัมประสิทธิ์สหสัมพันธ์เชิงเส้นซึ่งคำนวณโดยใช้สูตร: ค่าวิกฤตของการทดสอบของนักเรียน ที เกาะครีตพบตามตารางสถิติระดับนัยสำคัญที่แนะนำ α=0.05และสำหรับ n-2
ระดับความเป็นอิสระ หากคำนวณค่าแล้ว ร เอ็กซ์ซีไม่น้อยกว่าค่าวิกฤต ร เกาะครีตแล้วความสัมพันธ์ระหว่างตัวแปรต่างๆ x
และ
ย
ถือว่าจำเป็น มาคำนวณกัน: เนื่องจากว่า ลองคำนวณค่าสัมประสิทธิ์ของสมการการถดถอย: ดังนั้นเราจึงได้สมการการถดถอยเชิงเส้น: ใช้สมการการถดถอย เราวาดเส้นตรงในรูปที่ 5.1.2 ใช่ (5;9.8) 9
4
(0;-0.2) 1 2 3 4 5 x
รูปที่ 5.1.2 พิกัดจุดทดลองและค่าประมาณ การพึ่งพาเชิงเส้นของพวกเขา เมื่อใช้สมการการถดถอย เราคำนวณค่าของฟังก์ชันตามจุดทดลองของตาราง 5.1.1 และความแตกต่างระหว่างค่าการทดลองและค่าที่คำนวณได้ของฟังก์ชันซึ่งเรานำเสนอในตาราง 5.1.2 ตารางที่ 5.1.2 ลองคำนวณค่าคลาดเคลื่อนกำลังสองเฉลี่ยและอัตราส่วนของค่าดังกล่าวต่อค่าเฉลี่ย: ในแง่ของอัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ย ผลลัพธ์ที่ได้ไม่เป็นที่น่าพอใจ เนื่องจากเกินค่าที่แนะนำคือ 0.05 มาประเมินระดับนัยสำคัญของค่าสัมประสิทธิ์สมการถดถอยโดยใช้การทดสอบของนักเรียน: จากตารางสถิติสำหรับ ระดับความอิสระ 3 องศา ลองเขียนเส้นที่มีระดับนัยสำคัญ - และคุณค่าของเกณฑ์ของผู้เรียน –
ทีไปที่ตาราง 5.1.3 ตารางที่ 5.1.3 ระดับนัยสำคัญของค่าสัมประสิทธิ์สมการถดถอย: โปรดทราบว่าตามระดับนัยสำคัญของค่าสัมประสิทธิ์ ได้ผลลัพธ์ที่น่าพอใจและสำหรับค่าสัมประสิทธิ์ ไม่น่าพอใจ ให้เราประเมินคุณภาพของสมการการถดถอยผลลัพธ์โดยใช้ตัวบ่งชี้ที่คำนวณบนพื้นฐานของการวิเคราะห์ความแปรปรวน: การตรวจสอบ: ผลลัพธ์ของการตรวจสอบเป็นค่าบวกซึ่งระบุถึงความถูกต้องของการคำนวณที่ดำเนินการ มาคำนวณเกณฑ์ฟิชเชอร์กัน: มีอิสระสองระดับ: เมื่อใช้ตารางสถิติ เราค้นหาค่าวิกฤตของเกณฑ์ฟิชเชอร์สำหรับการไล่ระดับนัยสำคัญสองระดับที่แนะนำ: เนื่องจากค่าที่คำนวณได้ของการทดสอบฟิชเชอร์เกินค่าวิกฤตสำหรับระดับนัยสำคัญที่ 0.01 เราจะถือว่าระดับนัยสำคัญตามการทดสอบฟิชเชอร์นั้นน้อยกว่า 0.01 ซึ่งจะถือว่าน่าพอใจ ลองคำนวณค่าสัมประสิทธิ์ของการพิจารณาหลายรายการ: เพื่ออิสรภาพสองระดับ เมื่อใช้ตารางสถิติสำหรับระดับนัยสำคัญที่แนะนำคือ 0.05 และระดับความอิสระสองระดับที่พบ เราจะพบค่าวิกฤตของสัมประสิทธิ์ของการพิจารณาพหุคูณ: เนื่องจากค่าที่คำนวณได้ของสัมประสิทธิ์ของการพิจารณาหลายรายการเกินค่าวิกฤตสำหรับระดับนัยสำคัญ ดังนั้นพารามิเตอร์ที่คำนวณได้ที่ได้รับในแง่ของอัตราส่วนของข้อผิดพลาดมาตรฐานต่อค่าเฉลี่ยและระดับนัยสำคัญตามการทดสอบของนักเรียนจึงไม่เป็นที่น่าพอใจ ดังนั้นจึงแนะนำให้เลือกการพึ่งพาอื่นโดยประมาณสำหรับการประมาณ ตัวอย่างที่ 5.2การประมาณการแจกแจงเชิงทดลองของตัวเลขสุ่มโดยการพึ่งพาทางคณิตศาสตร์ การแจกแจงการทดลองของตัวเลขสุ่มที่กำหนดในตาราง 5.1.1 เมื่อประมาณด้วยการพึ่งพาเชิงเส้น ไม่ได้นำไปสู่ผลลัพธ์ที่น่าพอใจ รวมทั้ง เนื่องจากไม่มีนัยสำคัญของค่าสัมประสิทธิ์ของสมการการถดถอยด้วยเทอมอิสระ ดังนั้นเพื่อปรับปรุงคุณภาพของการประมาณเราจะพยายามดำเนินการโดยใช้การพึ่งพาเชิงเส้นโดยไม่มีเทอมอิสระ: ลองคำนวณค่าสัมประสิทธิ์ของสมการการถดถอย: ดังนั้นเราจึงได้สมการถดถอย: เมื่อใช้สมการการถดถอยที่ได้เราจะคำนวณค่าของฟังก์ชันและความแตกต่างระหว่างค่าทดลองและค่าที่คำนวณได้ของฟังก์ชันซึ่งเรานำเสนอในรูปแบบของตาราง 5.2.1 ตารางที่ 5.2.1 x ฉัน ตามสมการถดถอย ใช่ (5;9.73
)
(0;0)
1 2 3 4 5 x
รูปที่ 5.2.1 พิกัดจุดทดลองและค่าประมาณ การพึ่งพาเชิงเส้นของพวกเขา เพื่อประเมินคุณภาพของการประมาณ เราจะทำการคำนวณตัวบ่งชี้คุณภาพที่คล้ายกับการคำนวณที่ให้ไว้ในตัวอย่างที่ 5.1 (ยังคงเก่า); มีอิสระ 4 องศา สำหรับ จากผลลัพธ์ของการประมาณ เราสังเกตว่าในแง่ของระดับนัยสำคัญของสัมประสิทธิ์ของสมการการถดถอย จะได้ผลลัพธ์ที่น่าพอใจ อัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ยได้รับการปรับปรุงให้ดีขึ้น แต่ยังสูงกว่าค่าที่แนะนำคือ 0.05 ดังนั้นจึงแนะนำให้ทำซ้ำการประมาณด้วยความสัมพันธ์ทางคณิตศาสตร์ที่ซับซ้อนมากขึ้น ตัวอย่างที่ 5.3เพื่อปรับปรุงคุณภาพของการประมาณตัวอย่างที่ 5.1 และ 5.2 เราจะดำเนินการการประมาณแบบไม่เชิงเส้นโดยการพึ่งพา
ค่านิยม
โดยใช้ตัวประมวลผลสเปรดชีต Excel №
วาร์ №
วาร์ №
วาร์ №
วาร์ №
วาร์ №
วาร์ №
วาร์
(5.5.2)
(5.5.3)
เราได้รับ
ค่าที่เหมาะสมที่สุด ข 0
,
ข 1
และ ข 2
.
สำหรับการประมาณโดยการพึ่งพา (5.5.2) และยิ่งกว่านั้น (5.5.1) ยังไม่ได้รับสูตรง่าย ๆ สำหรับการคำนวณค่าสัมประสิทธิ์และตามกฎแล้วจะคำนวณโดยใช้ขั้นตอนมาตรฐานในรูปแบบเมทริกซ์:
.
เราสรุปได้ว่าความสัมพันธ์ระหว่างตัวแปร เอ็กซ์และ ที่มีความสำคัญและสามารถเป็นเส้นตรงได้
แล้วระดับนัยสำคัญตามค่าสัมประสิทธิ์การกำหนดพหุคูณ
และผลลัพธ์ที่ได้สำหรับตัวบ่งชี้ที่ส่งมาจะถือว่าน่าพอใจ
ในรูปที่ 5.2.1 เราจะวาดเส้นตรง
- ในการดำเนินการนี้ ก่อนอื่นเราจะทำการคำนวณระดับกลางและวางผลลัพธ์ไว้ในตาราง 5.3.1
เอ็กซ์ 2 | ||||||
(อินเอ็กซ์) 2 | ||||||
lnX lnY |
มาคำนวณเพิ่มเติม:
ให้เราประมาณการพึ่งพาอาศัยกัน
- การใช้สูตร (5.3.7), (5.3.8) เราคำนวณค่าสัมประสิทธิ์ ข 0
และ ข 1
:
การใช้สูตร (5.3.11) เราคำนวณค่าสัมประสิทธิ์ ก 0 และ ก 1 :
ในการคำนวณข้อผิดพลาดมาตรฐาน จะทำการคำนวณขั้นกลางดังแสดงในตารางที่ 5.3.2
ตารางที่ 5.3.2
ย ฉัน |
ย ฉัน | ||
จำนวน: 7.5968
ข้อผิดพลาดมาตรฐานของการประมาณกลายเป็นค่าที่มากกว่าในสองตัวอย่างก่อนหน้านี้มาก ดังนั้นเราจึงถือว่าผลลัพธ์ของการประมาณนั้นใช้ไม่ได้
ตัวอย่างที่ 5.4ลองประมาณด้วยการพึ่งพาแบบไม่เชิงเส้นอื่นกัน
- ใช้สูตร (5.3.9), (5.3.10) ตามตาราง 5.3.1 เราคำนวณค่าสัมประสิทธิ์ ข 0
และ ข 1
:
เราได้รับการพึ่งพาระดับกลาง:
การใช้สูตร (5.3.13) เราคำนวณค่าสัมประสิทธิ์ ค 0 และ ค 1 :
เราได้รับการพึ่งพาขั้นสุดท้าย:
ในการคำนวณข้อผิดพลาดมาตรฐาน เราจะดำเนินการคำนวณขั้นกลางและวางไว้ในตาราง 5.4.1
ตารางที่ 5.4.1
ย ฉัน |
ย ฉัน | ||
จำนวน: 21.83152
มาคำนวณข้อผิดพลาดมาตรฐานกัน:
ข้อผิดพลาดมาตรฐานของการประมาณกลายเป็นข้อผิดพลาดที่มากกว่าตัวอย่างก่อนหน้ามาก ดังนั้นเราจึงถือว่าผลลัพธ์การประมาณไม่สามารถใช้งานได้
ตัวอย่างที่ 5.5การประมาณการแจกแจงเชิงทดลองของตัวเลขสุ่มโดยการพึ่งพาทางคณิตศาสตร์ ย = ข · ไม่เป็นไร
ข้อมูลเริ่มต้นดังตัวอย่างก่อนหน้านี้แสดงในตาราง 5.4.1 และรูปที่ 5.4.1
ตารางที่ 5.4.1
จากการวิเคราะห์รูปที่ 5.4.1 และตาราง 5.4.1 เราทราบว่าด้วยค่าอาร์กิวเมนต์ที่น้อยกว่า (ที่จุดเริ่มต้นของตาราง) ฟังก์ชันจะเปลี่ยนไปมากกว่าค่าที่มากขึ้น (ที่ส่วนท้ายของ ตาราง) ดังนั้นจึงแนะนำให้เปลี่ยนขนาดของอาร์กิวเมนต์และแนะนำฟังก์ชันลอการิทึมในสมการการถดถอยจากนั้นและประมาณด้วยการพึ่งพาทางคณิตศาสตร์ต่อไปนี้:
- ใช้สูตร (5.4.3) เราคำนวณค่าสัมประสิทธิ์ ข:
เพื่อประเมินคุณภาพของการประมาณ เราจะทำการคำนวณขั้นกลางที่แสดงในตาราง 5.4.2 ซึ่งเราจะคำนวณขนาดของข้อผิดพลาดและอัตราส่วนของข้อผิดพลาดมาตรฐานต่อค่าเฉลี่ย
ตารางที่ 5.4.2
เนื่องจากอัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ยเกินค่าที่แนะนำคือ 0.05 ผลลัพธ์จึงถือว่าไม่เป็นที่น่าพอใจ โดยเฉพาะอย่างยิ่ง เราสังเกตว่าค่าเบี่ยงเบนที่ยิ่งใหญ่ที่สุดนั้นกำหนดไว้ x=1,เนื่องจากด้วยค่านี้ ไม่เป็นไร=0. ดังนั้นเราจะประมาณการพึ่งพาอาศัยกัน ย = ข 0 +ข 1 ไม่เป็นไร
เรานำเสนอการคำนวณเสริมในรูปแบบของตาราง 5.4.3
ตารางที่ 5.4.3
การใช้สูตร (5.4.6) และ (5.4.7) เราคำนวณค่าสัมประสิทธิ์ ข 0 และ ข 1 :
9 (5;9.12)
4
1 (1;0.93)
1 2 3 4 5 x
เพื่อประเมินคุณภาพของการประมาณเราจะทำการคำนวณเสริมและกำหนดระดับนัยสำคัญของค่าสัมประสิทธิ์ที่พบและอัตราส่วนของข้อผิดพลาดมาตรฐานต่อค่าเฉลี่ย
ระดับความสำคัญ สูงกว่าค่าแนะนำเล็กน้อยที่ 0.05 (
).
เนื่องจากตามตัวบ่งชี้หลัก - อัตราส่วนของข้อผิดพลาดมาตรฐานต่อค่าเฉลี่ย - ได้รับเกินระดับที่แนะนำเกือบสองเท่าที่ 0.05 เราจะพิจารณาผลลัพธ์ที่ยอมรับได้ โปรดทราบว่าค่าที่คำนวณได้จากการทดสอบของนักเรียน ที ข 0
=2,922
แตกต่างจากที่สำคัญ
ด้วยจำนวนที่ค่อนข้างน้อย
ตัวอย่างที่ 5.6ให้เราประมาณข้อมูลการทดลองของตัวอย่างที่ 5.1 โดยการพึ่งพาไฮเปอร์โบลิก
- เพื่อคำนวณค่าสัมประสิทธิ์ ข 0 และ ข 1
ดำเนินการคำนวณเบื้องต้นตามตารางที่ 5.6.1
ตารางที่ 5.6.1
เอ็กซ์ ฉัน |
x ฉัน =1/เอ็กซ์ ฉัน |
x ฉัน 2 |
x ฉัน ย ฉัน | ||
จากผลลัพธ์ของตาราง 5.6.1 โดยใช้สูตร (5.4.8) และ (5.4.9) เราคำนวณค่าสัมประสิทธิ์ ข 0 และ ข 1 :
ดังนั้นจึงได้สมการการถดถอยไฮเปอร์โบลิก
.
ผลลัพธ์ของการคำนวณเสริมสำหรับการประเมินคุณภาพของการประมาณแสดงไว้ในตาราง 5.6.2
ตารางที่ 5.6.2
เอ็กซ์ ฉัน | ||||
จากผลลัพธ์ของตาราง 5.6.2 เราคำนวณค่าคลาดเคลื่อนมาตรฐานและอัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ย:
เนื่องจากอัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ยเกินค่าที่แนะนำคือ 0.05 เราจึงสรุปได้ว่าผลลัพธ์การประมาณนั้นไม่เหมาะสม
ตัวอย่างที่ 5.7
ในการคำนวณมูลค่าเฉพาะของรายได้จากการทำงานของเครน jib ขึ้นอยู่กับเวลาของงานบำรุงรักษาจำเป็นต้องได้รับการพึ่งพาพาราโบลา
ให้เราคำนวณค่าสัมประสิทธิ์ของการพึ่งพานี้ ข 0 , ข 1 , ข 11 ในรูปแบบเมทริกซ์ตามสูตร:
ได้รับสมการการถดถอยแบบไม่เชิงเส้นที่เชื่อมต่อตัวบ่งชี้ที่มีประสิทธิผลกับค่าที่เหมาะสมที่สุดสำหรับการดำเนินการบำรุงรักษาเชิงป้องกันของทาวเวอร์เครนโดยใช้ขั้นตอนการถดถอยพหุคูณของแพ็คเกจแอปพลิเคชัน Statistica 6.0 ต่อไป เราจะนำเสนอผลการวิเคราะห์การถดถอยสำหรับตัวบ่งชี้ประสิทธิภาพที่มีประสิทธิผลตามตารางที่ 5.7.1
ตารางที่ 5.7.1
ตารางที่ 5.7.2 แสดงผลการถดถอยแบบไม่เชิงเส้นสำหรับตัวบ่งชี้ประสิทธิภาพที่มีประสิทธิผล และตาราง 5.7.3 แสดงผลการวิเคราะห์สารตกค้าง
ตารางที่ 5.7.2
ตารางที่ 5.7.3
ข้าว. 3.7.36. การวิเคราะห์สารตกค้าง
ดังนั้นเราจึงได้สมการถดถอยพหุคูณสำหรับตัวแปร
:
อัตราส่วนของข้อผิดพลาดมาตรฐานต่อค่าเฉลี่ย:
14780/1017890=0,0145 < 0,05.
เนื่องจากอัตราส่วนของค่าคลาดเคลื่อนมาตรฐานต่อค่าเฉลี่ยจะต้องไม่เกินค่าที่แนะนำคือ 0.05 ผลการประมาณจึงถือว่ายอมรับได้ ข้อเสียเปรียบตามตาราง 5.7.2 ควรสังเกตว่าค่าสัมประสิทธิ์ที่คำนวณได้ทั้งหมดเกินระดับนัยสำคัญที่แนะนำที่ 0.05
1. การวัดใดต่อไปนี้อยู่ในประเภทของชื่อมาตราส่วนการวัด:
ก) อารมณ์การเข้ารหัสตัวเลข
ง) หมายเลขโทรศัพท์
2. การวัดใดต่อไปนี้อยู่ในคลาสลำดับของเครื่องชั่งวัด:
b) ตำแหน่งทางวิชาการที่เป็นตัวชี้วัดความก้าวหน้าในอาชีพ
ค) ระบบการวัดระยะทางแบบเมตริก
ง) หมายเลขโทรศัพท์
3. การวัดใดต่อไปนี้อยู่ในประเภทของอัตราส่วนของสเกลการวัด:
ก) อารมณ์การเข้ารหัสตัวเลข
b) ตำแหน่งทางวิชาการที่เป็นตัวชี้วัดความก้าวหน้าในอาชีพ
ค) ระบบการวัดระยะทางแบบเมตริก
ง) หมายเลขโทรศัพท์
4. ลักษณะใดต่อไปนี้เป็นของสายพันธุ์เชิงปริมาณ:
b) ความสัมพันธ์ทางครอบครัวของสมาชิกในครอบครัว
ค) เพศและอายุของบุคคล
ง) สถานะทางสังคมของผู้ฝาก
e) จำนวนเด็กในครอบครัว
f) มูลค่าการขายปลีกของวิสาหกิจการค้า
5. ลักษณะใดต่อไปนี้เป็นของประเภทเชิงคุณภาพ:
ก) จำนวนพนักงานในบริษัท
b) ความสัมพันธ์ทางครอบครัวของสมาชิกในครอบครัว
ค) เพศและอายุของบุคคล
ง) สถานะทางสังคมของผู้ฝาก
e) จำนวนเด็กในครอบครัว
f) มูลค่าการขายปลีกของวิสาหกิจการค้า
6. มาตราส่วนใดที่ใช้วัดระดับสติปัญญาของบุคคล:
ก) ชื่อ;
b) ลำดับ;
ค) ช่วงเวลา;
ง) ความสัมพันธ์
7. ส่วนเบี่ยงเบนมาตรฐานคือ:
ก) กำลังสองของช่วงของอนุกรมรูปแบบต่างๆ
b) รากที่สองของความแปรปรวน;
c) สัมประสิทธิ์การแปรผันกำลังสอง;
d) รากที่สองของขนาดของช่วงการเปลี่ยนแปลง
8. ค่าสัมประสิทธิ์ของการแปรผันของอนุกรมถูกกำหนดโดยอัตราส่วน:
ก) ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยเลขคณิตของอนุกรม
b) ความแปรปรวนของค่ามัธยฐานของอนุกรม;
c) การกระจายไปยังค่าสูงสุดของอนุกรม
d) ตัวบ่งชี้สัมบูรณ์ของการแปรผันของค่าเฉลี่ยเลขคณิตของอนุกรม
9. แฟชั่นของซีรีย์รูปแบบนี้
x 10 15 35
ไม่มี 1 2 3
นี้:
ก) 20;
ข) 16;
ค) 3;
ง) 35.
10. ค่าเฉลี่ยเลขคณิตของประชากรคือ:
ก) ค่าของคุณลักษณะที่อยู่ตรงกลางของอนุกรมการเปลี่ยนแปลง
b) ความแตกต่างครึ่งหนึ่งระหว่างค่าสูงสุดและต่ำสุดของชุดรูปแบบต่างๆ
c) ครึ่งหนึ่งของผลรวมของค่าสูงสุดและต่ำสุดของชุดรูปแบบต่างๆ
d) อัตราส่วนของผลรวมของปริมาณทั้งหมดในประชากรต่อจำนวนทั้งหมด
11. ทราบข้อมูลเกี่ยวกับประสบการณ์การทำงานของพนักงานขายในร้านเจ็ดคน: 2; 3; 2; 5; 10; 7; 1 ปี ค้นหามูลค่าเฉลี่ยของประสบการณ์การทำงานของพวกเขา
ก) 4.3 ปี;
ข) 5 ปี;
ค) 3 ปี;
ง) 3.8 ปี
12. ชุดการจัดจำหน่ายคือ:
ก) ลำดับของข้อมูลตัวอย่าง
b) สั่งการจัดเรียงข้อมูลตามคุณลักษณะเชิงปริมาณ
c) ลำดับตัวเลขของข้อมูล
d) ลำดับของค่า เรียงลำดับตามคุณลักษณะเชิงคุณภาพ
13. ความถี่ของการแปรผันของอนุกรมการแปรผันเรียกว่า:
ก) ขนาดตัวอย่าง;
b) ความหมายของชุดตัวเลือกต่างๆ
c) จำนวนตัวแปรเดี่ยวหรือกลุ่มของอนุกรมรูปแบบ
d) จำนวนกลุ่มของซีรีย์รูปแบบต่างๆ
14. แฟชั่นคือ:
ก) ค่าสูงสุดของลักษณะประชากร
b) ค่าทั่วไปของแอตทริบิวต์;
c) ค่าเฉลี่ยเลขคณิตของประชากร
15. ทราบข้อมูลเกี่ยวกับระยะเวลาการให้บริการของพนักงานขายในร้าน: 2; 3; 2; 5; 10; 7; 1. ค้นหาค่ามัธยฐานของประสบการณ์การทำงาน:
ก) 4.5 ปี;
ข) 4.3 ปี
ค) 3 ปี;
ง) 5 ปี
16. ช่วงการเปลี่ยนแปลงของซีรี่ส์รูปแบบนี้:
x 10 15 20 30
หมายเลข 1 2 3 2
นี้:
ก) 15;
ข) 10;
ค) 30;
ง) 20.
17. จำนวนชุดที่สั่งแบ่งครึ่ง:
ก) แฟชั่น;
b) ค่าเฉลี่ยเลขคณิต;
c) ค่าเฉลี่ยฮาร์มอนิก
d) ค่ามัธยฐาน
18. การจัดกลุ่มทางสถิติคือ:
ก) การรวมหรือแยกข้อมูลตามลักษณะสำคัญ
b) การจัดระเบียบทางวิทยาศาสตร์ของการสังเกตทางสถิติ
c) ประเภทของการรายงาน;
d) การรวบรวมข้อมูลมวลโดยตรง
19. ค่าสัมประสิทธิ์การสั่นคือ:
ก) ตัวบ่งชี้สัมบูรณ์;
ข) เฉลี่ย;
c) ตัวบ่งชี้สัมพัทธ์ของการเปลี่ยนแปลง
20. การกระจายตัวของอนุกรมรูปแบบต่างๆ มีลักษณะดังนี้:
ก) ค่าเฉลี่ยของลักษณะเฉพาะส่วนบุคคล
b) การกระจายตัวของค่าลักษณะเฉพาะจากค่าเฉลี่ย
c) ส่วนเบี่ยงเบนมาตรฐาน
21. สมการของฟังก์ชันการถดถอยเชิงเส้นสะท้อนถึงพลวัตของการพัฒนา:
ก) ด้วยความเร่งแปรผัน
c) เครื่องแบบ;
d) เร่งความเร็วสม่ำเสมอ
22. หากค่าสัมประสิทธิ์สหสัมพันธ์คือ 0.6 ดังนั้นในระดับ Chedd.ka:
ก) ไม่มีการเชื่อมต่อในทางปฏิบัติ
b) การเชื่อมต่ออ่อนแอ
c) การเชื่อมต่ออยู่ในระดับปานกลาง
d) การเชื่อมต่อมีความแข็งแกร่ง
23. ข้อมูลนี้แสดงถึงคะแนนของผู้ใหญ่ในการทดสอบ IQ ของ Stanford-Binet 104, 87, 101, 130, 148, 92, 97, 105, 134, 121 ค้นหาช่วงของการเปลี่ยนแปลง:
ก) 61;
ข) 60;
ค) 75.
24. จงหาค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสำหรับอนุกรมช่วงต่อไปนี้:
ลี่หนี่
10-14 1
15-19 1
20-24 4
25-29 2
30-34 4
ก) 24;
ข) 24.92;
ค) 25.38.
25. คำนวณค่ามัธยฐานของชุดถัดไป 2.1; 1.5; 1.6; 2.1; 2.4:
ก) 2;
ข) 1.5;
ค) 2.1.
26. คำนวณโหมดของอนุกรมช่วงเวลาถัดไป
ความถี่ 5-7 8-10 11-13 14-16
ช่วง 4 7 26 41
ก) 14;
ข) 14.54;
ค) 15.23;
27. การวัดใดต่อไปนี้อยู่ในประเภทของชื่อของตาชั่งวัด:
ก) การวินิจฉัยผู้ป่วย
b) ป้ายทะเบียน;
c) ความแข็งของแร่;
ง) เวลาตามปฏิทิน
e) น้ำหนักของบุคคล
28. การวัดใดต่อไปนี้จัดอยู่ในประเภทของสเกลการวัดลำดับ:
ก) การวินิจฉัยผู้ป่วย
b) ป้ายทะเบียน;
c) ความแข็งของแร่;
ง) เวลาตามปฏิทิน
e) น้ำหนักของบุคคล
29. การวัดใดต่อไปนี้อยู่ในคลาสของสเกลการวัดช่วงเวลา:
ก) การวินิจฉัยผู้ป่วย
b) ป้ายทะเบียน;
c) ความแข็งของแร่;
ง) เวลาตามปฏิทิน
e) น้ำหนักของบุคคล
30. การวัดใดต่อไปนี้อยู่ในประเภทของอัตราส่วนของสเกลการวัด:
ก) การวินิจฉัยผู้ป่วย
b) ป้ายทะเบียน;
c) ความแข็งของแร่;
ง) เวลาตามปฏิทิน
e) น้ำหนักของบุคคล
31. ใช้มาตราส่วนใดในการวัดเวลา:
ก) ช่วงเวลา;
ข) ความสัมพันธ์;
ค) แชดด็อก
32. ประเภทเชิงปริมาณมีลักษณะดังต่อไปนี้:
ก) ความสูงของมนุษย์
b) รางวัลสำหรับการทำบุญ;
c) สีตา;
d) ป้ายทะเบียน
33. ประเภทเชิงคุณภาพมีลักษณะดังต่อไปนี้:
ก) ความสูงของมนุษย์
b) รางวัลสำหรับการทำบุญ;
c) สีตา;
d) ป้ายทะเบียน
34. โหมดการคำนวณ
x 5 8 10 13 14
พรรณี 7 4 5 9 1
ก) 10;
ข) 11;
ค) 13
35. ในชั้นเรียนที่มีนักเรียนจำนวนมาก การได้รับความรู้ภายในหนึ่งในสี่จะประสบความสำเร็จน้อยกว่าในชั้นเรียนขนาดเล็ก สัญญาณที่มีประสิทธิภาพคืออะไร?
ก) จำนวนนักเรียนในชั้นเรียน;
b) ความสำเร็จในการรับความรู้
ค) จำนวนนักเรียนที่ประสบความสำเร็จในการได้รับความรู้
36. ความยาวของช่วงในชุดช่วงคือ:
ก) พิสัยของการแปรผันหารด้วยค่าเฉลี่ยเลขคณิต
b) ช่วงของการแปรผันหารด้วยจำนวนกลุ่ม
c) ความแปรปรวนหารด้วยขนาดตัวอย่าง
37. ตัวอย่างความสัมพันธ์แบบคู่: นักเรียนที่เรียนรู้การอ่านเร็วกว่าคนอื่นๆ มักจะมีผลการเรียนสูงกว่า ตัวบ่งชี้ใดต่อไปนี้: ความสามารถในการอ่านตั้งแต่เนิ่นๆ หรือผลสัมฤทธิ์ทางการเรียนในระดับสูงเป็นตัวบ่งชี้ปัจจัย
ก) ความสามารถในการอ่านตั้งแต่เนิ่นๆ
b) ผลการเรียนสูง;
c) ไม่มีเลย
38. สามารถใช้วิธีใดต่อไปนี้เมื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างตั้งแต่สามตัวอย่างขึ้นไป:
ก) การทดสอบของนักเรียน
ข) การทดสอบฟิชเชอร์
c) การวิเคราะห์ความแปรปรวน
39. ขนาดตัวอย่างของชุดรูปแบบต่างๆ
10 15 20 30
พรรณี 1 2 3 2
ก) 5;
ข) 8;
ค) 12;
ง) 30.
40. แฟชั่นซีรีส์หลากหลาย
10 15 20 25
พรรณี 1 5 4 3
ก) 15;
ข) 5;
ค) 23;
ง) 3.
41. สมการของฟังก์ชันการถดถอยพาราโบลาสะท้อนถึงพลวัตของการพัฒนา:
ก) ด้วยความเร่งแปรผัน
b) มีการชะลอตัวของการเติบโตเมื่อสิ้นสุดรอบระยะเวลา;
c) เครื่องแบบ;
d) เร่งความเร็วสม่ำเสมอ
42.ค่าสัมประสิทธิ์การถดถอย B แสดง:
ก) ค่าคาดหวังของตัวแปรตามที่มีค่าศูนย์ของตัวทำนาย
b) ค่าคาดหวังของตัวแปรตามเมื่อตัวทำนายเปลี่ยนไปทีละค่า
c) ความน่าจะเป็นของข้อผิดพลาดในการถดถอย
d) ปัญหานี้ยังไม่ได้รับการแก้ไขในที่สุด
43. การสุ่มตัวอย่างคือ:
ก) วัตถุทั้งชุดที่ใช้เหตุผลของผู้วิจัยเป็นพื้นฐาน
b) วัตถุที่หลากหลายสำหรับการวิจัยเชิงประจักษ์
c) ค่าการกระจายที่เป็นไปได้ทั้งหมด
d) เช่นเดียวกับการสุ่ม
44. ค่าสัมประสิทธิ์สหสัมพันธ์ข้อใดต่อไปนี้แสดงให้เห็นถึงความสัมพันธ์ที่ยิ่งใหญ่ที่สุดระหว่างตัวแปร:
ก) -0.90;
ข) 0;
ค) 0.07;
ง) 0.01
45. ประชากรทั่วไปคือ:
ก) วัตถุทั้งชุดที่ใช้เหตุผลของผู้วิจัยเป็นพื้นฐาน
b) วัตถุที่หลากหลายสำหรับการวิจัยเชิงประจักษ์
c) ค่าที่เป็นไปได้ทั้งหมดของความคาดหวังทางคณิตศาสตร์
d) การกระจายแบบปกติ
46. ขนาดตัวอย่างและประชากรทั่วไปเปรียบเทียบกันอย่างไร:
ก) โดยทั่วไปกลุ่มตัวอย่างจะมีขนาดเล็กกว่าประชากรทั่วไปอย่างมีนัยสำคัญ
b) ประชากรมีขนาดเล็กกว่ากลุ่มตัวอย่างเสมอ
c) กลุ่มตัวอย่างและประชากรเกือบจะตรงกันเสมอ
d) ไม่มีคำตอบที่ถูกต้อง
47. ค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลเป็นกรณีพิเศษของค่าสัมประสิทธิ์สหสัมพันธ์:
ก) สเปียร์แมน;
ข) เพียร์สัน;
ค) เคนดัล;
d) คำตอบทั้งหมดถูกต้อง
48. ในระดับนัยสำคัญขั้นต่ำใดที่เป็นธรรมเนียมที่จะปฏิเสธสมมติฐานว่าง?
ก) ระดับ 5%
ข) ระดับ 7%
ค) ระดับ 9%
ง) ระดับ 10%
49. โดยปกติจะใช้วิธีใดต่อไปนี้เมื่อเปรียบเทียบค่าเฉลี่ยในสองตัวอย่างปกติ:
ก) การทดสอบของนักเรียน
ข) การทดสอบฟิชเชอร์
c) การวิเคราะห์ความแปรปรวนทางเดียว
d) การวิเคราะห์ความสัมพันธ์
50. มีการทดสอบสมมติฐานทางสถิติอย่างไร?
ก) นักสถิติ;
ข) พารามิเตอร์;
ค) การทดลอง;
ง) การสังเกต
51. ค่าสัมประสิทธิ์สหสัมพันธ์ค่าใดต่อไปนี้เป็นไปไม่ได้:
ก) -0.54;
ข) 2.18;
ค) 0; ง) 1.
52. ต้องทำการเปลี่ยนแปลงอะไรเมื่อเปรียบเทียบค่าสัมประสิทธิ์สหสัมพันธ์สองค่า:
ก) นักศึกษา;
ข) ฟิสเชอร์;
ค) เพียร์สัน;
ง) สเปียร์แมน
53. ค่ามัธยฐานของการแจกแจงคือเท่าใด:
ก) เช่นเดียวกับเส้นแบ่งครึ่ง;
b) เช่นเดียวกับแฟชั่น
c) ค่าเฉลี่ยเลขคณิต;
d) ปริมาณการกระจาย 50%
d) ไม่มีคำตอบที่ถูกต้อง
54. ค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลเป็นกรณีพิเศษของค่าสัมประสิทธิ์สหสัมพันธ์:
ก) สเปียร์แมน;
ข) เพียร์สัน;
ค) เคนดัลล์;
d) คำตอบทั้งหมดถูกต้อง
55.ตัวแปรใดต่อไปนี้ไม่ต่อเนื่องกัน:
ก) ประเภทของอารมณ์
b) ระดับสติปัญญา;
c) เวลาปฏิกิริยา;
d) คำตอบทั้งหมดถูกต้อง
56. ค่าสัมประสิทธิ์สหสัมพันธ์สามารถเปลี่ยนแปลงได้ในช่วงใด:
ก) จาก –1 ถึง 1;
ข) จาก 0 ถึง 1;
ค) จาก 0 ถึง 100;
d) ในใด ๆ
57. สมมติฐานทางสถิติที่ถูกหยิบยกเกี่ยวกับคืออะไร:
ก) แนวคิด;
b) นักสถิติ;
ค) ตัวอย่าง;
ง) พารามิเตอร์
58. ชื่อของการวิเคราะห์ความแปรปรวนแบบไม่มีพารามิเตอร์คืออะไร:
ก) การทดสอบของนักเรียน
b) วิธีครัสคัล-วาลลิส
c) การทดสอบวิลคอกซัน;
ง) การทดสอบแมนน์-วิทนีย์
59. แนวคิดเรื่องสัมประสิทธิ์สหสัมพันธ์ได้รับการพัฒนาครั้งแรกในงาน:
ก) ฟิสเชอร์;
b) การทดสอบของนักเรียน
ค) เพียร์สัน;
ง) สเปียร์แมน
60. สถิติใดต่อไปนี้เป็นการประมาณค่าที่คาดหวังอย่างเป็นกลาง:
ก) ค่าเฉลี่ยเลขคณิต;
ข) แฟชั่น;
ค) ค่ามัธยฐาน;
d) คำตอบทั้งหมดถูกต้อง
61. ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันและสเปียร์แมนเปรียบเทียบได้อย่างไร:
ก) สัมประสิทธิ์เพียร์สันเป็นกรณีพิเศษของสเปียร์แมน
b) สัมประสิทธิ์สเปียร์แมนเป็นกรณีพิเศษของเพียร์สัน
c) ค่าสัมประสิทธิ์เหล่านี้มีตรรกะในการก่อสร้างที่แตกต่างกัน
ง) มันเป็นสิ่งเดียวกัน
62. ตามสมมติฐานทางทฤษฎีของการวิเคราะห์ความแปรปรวน อัตราส่วน F ไม่สามารถเป็น:
ก) เท่ากับ 1;
ข) มากกว่า 1;
ค) น้อยกว่า 1;
d) ไม่มีคำตอบที่ถูกต้อง