2553 - cuir.car.chula.ac.th
Transcript of 2553 - cuir.car.chula.ac.th
ก
การเปรยบเทยบประสทธภาพของการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความ
เชอมนใหม
นายสญชย พทกษชลทรพย
วทยานพนธนเปนสวนหนงของการศกษาตามหลกสตรปรญญาวทยาศาสตรมหาบณทต สาขาวชาการพฒนาซอฟตแวรดานธรกจ ภาควชาสถต
คณะพาณชยศาสตรและการบญช จฬาลงกรณมหาวทยาลย ปการศกษา 2553
ลขสทธของจฬาลงกรณมหาวทยาลย
ข
A COMPARISON OF THE EFFICIENCY OF APPLYING ASSOCIATION RULE DISCOVERY ON SOFTWARE ARCHIVE USING SUPPORT – CONFIDENCE MODEL AND
SUPPORT – NEW CONFIDENCE MODEL
Mr. Sunchai Pitakchonlasup
A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Science Program in Business Software Development
Department of Statistics Faculty of Commerce and Accountancy
Chulalongkorn University Academic Year 2010
Copyright of Chulalongkorn University
ฉ
กตตกรรมประกาศ
วทยานพนธนจะส าเรจลลวงและสมบรณไปไดดวยดตองขอกราบขอบพระคณผ ชวย
ศาสตราจารย ดร. อษฎาพร ทรพยสมบรณ อาจารยทปรกษาวทยานพนธเปนอยางยงทไดให
ค าแนะน าและขอคดเหนตางๆ ตรวจแกวทยานพนธฉบบนอยางละเอยด ตลอดจนแนวทางในการ
วจยดวยดตลอดมา ขอขอบพระคณผชวยศาสตราจารย ดร.สมจาร ปรยานนท และอาจารย ดร.
จนทรเจา มงคลนาวน กรรมการสอบวทยานพนธทกรณาเสยสละเวลาใหค าปรกษาและให
ค าแนะน า เพอแกไขรปแบบและเนอหาวทยานพนธฉบบนจนเสรจสมบรณ และขอบพระคณ
อาจารย ดร. อรณ ก าลง ทใหค าปรกษาเกยวกบการวเคราะหขอมลในการทดลอง
ขอบคณเพอนๆ ทใหค าปรกษาและความชวยเหลอในดานตางๆ ซงท าใหงานวจยเปนไป
ไดอยางราบรนตลอดจนก าลงใจทมอบใหเสมอมา
สดทายน ผ วจยใครกราบขอบพระคณบดา มารดาและครอบครวทคอยชวยเหลอใหการ
สนบสนนและคอยเปนแรงกระตนใหแกผวจยเสมอจนส าเรจการศกษา
ช
สารบญ
หนา บทคดยอภาษาไทย……………………………………………………………………….……...…ง
บทคดยอภาษาองกฤษ..........................................................................................................จ
กตตกรรมประกาศ.................................................................................................................ฉ
สารบญ…………..................................................................................................................ช
สารบญตาราง.…..................................................................................................................ฏ
สารบญภาพ……..................................................................................................................ฐ บทท 1 ทมาและความส าคญของปญหา……... ............................................................... 1
1.1 บทน า ......................................................................................................................... 1
1.2 ความเปนมาและความส าคญของปญหา ...................................................................... 2
1.2.1 ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญ ............................................................................. 2
1.2.2 ความส าคญและปญหาของกฎความสมพนธและคาประเมนความนาสนใจของกฎความสมพนธ ............................................................................................................... 4
1.2.3 ความส าคญและปญหาของการประยกตใชเทคนคการคนหากฎความ สมพนธกบขอมลซอฟตแวรอารไคฟว ............................................................................................. 9
1.3 วตถประสงคของงานวจย ........................................................................................... 11
1.4 ขนตอนโดยสรปของการท าวจย .................................................................................. 12
1.5 ตวแปรทศกษา .......................................................................................................... 12
1.6 ขอบเขตของการวจย .................................................................................................. 15
1.7 ประโยชนทคาดวาจะไดรบ ......................................................................................... 16
1.8 นยามศพท ................................................................................................................ 16
บทท 2 ทบทวนวรรณกรรมทเกยวของ…….. ................................................................ 19
2.1 บทน า ....................................................................................................................... 19
2.2 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) ..................................................................................................................... 20
ซ
2.3 การประเมนความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules) ........................................................................................................ 21
2.3.1 คาสนบสนน (Support) ..................................................................................... 22
2.3.2 คาความเชอมน (Confidence) ........................................................................... 23
2.3.3 คาคอนวคชน (Conviction) ................................................................................ 24
2.3.4 คาลฟท (Lift) .................................................................................................... 25
2.3.5 คาเลฟเวอเรจ (Leverage) ................................................................................. 26
2.3.6 คาคฟเวอเรจ (Coverage) ................................................................................. 27
2.3.7 คาสหสมพนธ (Correlation) .............................................................................. 27
2.3.8 คาอตราสวนออดส (Odds Ratio) ...................................................................... 28
2.4 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม ........................................ 29
2.4.1 ขอบกพรองของตวแบบคาสนบสนน-คาความเชอมน ........................................... 29
2.4.2 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม ................................. 31
2.5 คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม .............................. 33
2.6 การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control) ..................... 51
2.6.1 แนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) ....................................................................................................... 52
2.6.2 ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) ..................................................................................................... 55
2.6.3 ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ..................... 57
2.7 การประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive) ........................ 60
2.8 ขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ............................................................... 63
2.8.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ..................................................................... 63
2.8.2 การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) .................................................................................................................. 75
ฌ
2.9 การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ................................................................................................ 81
2.9.1 คาความถกตอง (Precision) .............................................................................. 83
2.9.2 คาเรยกคน (Recall) .......................................................................................... 83
2.9.3 คาเอฟเมสเชอร (F-measure) ............................................................................ 84
2.9.4 คาผลสะทอนกลบ (Feedback) ......................................................................... 86
บทท 3 ระเบยบวธวจย……… ........................................................................................ 87
3.1 บทน า ....................................................................................................................... 87
3.2 แผนแบบการทดลอง .................................................................................................. 87
3.2.1 ตวแปรตน ......................................................................................................... 88
3.2.2 ตวแปรตาม ....................................................................................................... 89
3.3 สมมตฐานงานวจย .................................................................................................... 90
3.4 ประชากรและหนวยตวอยาง ...................................................................................... 93
3.5 แนวทางการท าวจย ................................................................................................... 97
3.6 ขนตอนทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ......................................................................................................... 99
3.6.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ............ 100
3.6.2 การสรางขอสอบถาม ....................................................................................... 114
3.6.3 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ .................................................................................................... 125
3.6.4 การสรางเซตของค าแนะน าส าหรบเหตการณ .................................................... 127
3.6.5 การประเมนผลการทดสอบ .............................................................................. 130
3.6.6 การทดสอบสมมตฐาน ..................................................................................... 134
3.7 เครองมอทใชในงานวจย .......................................................................................... 136
3.8 ความถกตอง (Validity) และคาความนาเชอถอ (Reliability) ของขอมลทเกบ .............. 142
3.9 กรอบการวเคราะหขอมล (Data Analysis Framework) ............................................. 144
บทท 4 ผลการวเคราะหขอมล……. ............................................................................. 146
4.1 บทน า ..................................................................................................................... 146
4.2 ผลการทดลอง ......................................................................................................... 146
ญ
4.3 ผลการวเคราะหขอมล ............................................................................................. 149
4.3.1 การวเคราะหการแจกแจงขอมล ........................................................................ 150
4.3.2 การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ .. 153
4.3.3 สรปผลการวเคราะหขอมล ............................................................................... 156
4.4 ผลการศกษาเพมเตม ............................................................................................... 157
4.4.1 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ................................................... 160
4.4.2 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า .... 169
4.4.3 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ........................................................................................................ 177
4.4.4 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า .......................................................................................................... 187
4.4.5 การวเคราะหคาประเมนระดบความนาสนใจของกฎความสมพนธในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด .............................................. 204
4.4.6 สรปผลการศกษาเพมเตม ................................................................................ 208
บทท 5 สรปผลการวจย……… ..................................................................................... 210
5.1 บทน า ..................................................................................................................... 210
5.2 การออกแบบการวจยและลกษณะของขอมลทน ามาใช .............................................. 210
5.3 สรปผลการวจย ....................................................................................................... 211
5.3.1 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง ................................ 212
ฎ
5.3.2 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด .. 213
5.3.3 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ............................................................................................................................... 214
5.4 การน างานวจยไปประยกตใช ................................................................................... 215
5.4.1 การน างานวจยไปใชในเชงทฤษฎ ...................................................................... 215
5.4.2 การน างานวจยไปใชในเชงประยกต .................................................................. 216
5.5 ขอจ ากดของงานวจย ............................................................................................... 217
5.6 แนวทางการศกษาตอเนอง ....................................................................................... 219
รายการอางอง .................................................................................................................. 220 ภาคผนวก ภาคผนวก ก การเลอกทรานแซคชนชดทดสอบ………….. ...................................... 229
ภาคผนวก ข ประเดนความถกตองและนาเชอถอของเครองมอทดสอบ............... .. 245
ภาคผนวก ค ตารางผลการทดสอบ .......................................................................... 250
ประวตผเขยนวทยานพนธ ............................................................................................... 261
ฏ
สารบญตาราง
ตาราง หนา
ตารางท 1-1 แสดงตารางสรปคาประเมนความนาสนใจของกฎความสมพนธ ............................ 6
ตารางท 2-1 แสดงตวอยางทรานแซคชนทประกอบดวยรายการ X Y และ Z ............................ 30
ตารางท 2-2 แสดงตวอยางรอยละของการปรากฏของรายการบนทรานแซคชนของรานขายของช าแหงหนง .............................................................................................................................. 31
ตารางท 2-3 แสดงตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ของกฎความสมพนธ XY .................................................................................................................................. 36
ตารางท 2-4 แสดงการเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด ................................................................................................................................ 50
ตารางท 3-1 แสดงรายละเอยดของซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) เกบขอมลในวนท 10 มกราคม พ.ศ. 2553 ................................................................................... 94
ตารางท 3-2 แสดงจ านวนของทรานแซคชนในแตละกลมทจะเลอกขนมาสรางเปนขอสอบถาม ......................................................................................................................................... 116
ตารางท ก-1 แสดงคาทางสถตเชงพรรณนาของขนาดทรานแซคชนในฐานขอมลซอฟตแวรอารไควฟโครงการเคมายมนน (KMyMoney) ……………………………………………….…….. 229 ตารางท ก-2 แสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆและจ านวนการปรากฎตางๆ …………………………………………………………………………………………….……..237 ตารางท ก-3 แสดงการแบงกลมจ านานการปรากฎของทรานแซคชนแตละขนาด ……….…….234 ตารางท ก-4 แสดงทรานแซคชนชดทดสอบ ……………………………………………….……235 ตารางท ค-1 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการน าทาง ……………….…..250 ตารางท ค-2 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการปองกนการเกดขอผดพลาด ……………………………………………………………………………………………….…..255 ตารางท ค-3 แสดงขอสอบถามทไดเซตของค าแนะน าเปนเซตวางในการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ………………………………………..………………….…..260
ฐ
สารบญภาพ
ภาพประกอบ หนา
รปท 2-1 แสดงการไหลของกจกรรมการควบคมการเปลยนแปลงแกไข ..................................... 53
รปท 2-2 แสดงตวอยางการคอมมทลงบนล าตนและบนกง ...................................................... 55
รปท 2-3 แสดงตวอยางแฟมขอมลบนทกของคอนเคอเรนทเวอรชน ......................................... 59
รปท 2-4 แสดงการท างานของขนตอนการสกดขอมล (Data Extraction) ................................. 67
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา ................................................................................................................... 70
รปท 2-6 แสดงตวอยางการตอกงและผสานกง ....................................................................... 75
รปท 3-1 แสดงขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว .............................................................................................................. 99
รปท 3-2 แสดงตวอยางแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน ............................... 102
รปท 3-3 แสดงตวอยางการพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา ................................................................................................................. 106
รปท 3-4 แสดงตวอยางการระบเอนทตภายในซอรสโคด 2 เวอรชนของแฟมขอมล IBuffer.java ......................................................................................................................................... 108
รปท 3-5 แสดงภาพรวมของเครองมอทใชในการทดสอบทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ....................................................... 137
รปท 3-6 แสดงแผนภาพออาร (ER Diagram) ฐานขอมลของเครองมอทใชในการทดสอบ ....... 138
รปท 4-1 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ................................... 148
รปท 4-2 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ..... 149
รปท 4-3 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง ....................................................................................................... 189
ฑ
รปท 4-4 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการปองกนการเกดขอผดพลาด ......................................................................... 189
รปท 4-5 แสดงทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวา.................................................................. 207
1
บทท 1 ทมาและความส าคญของปญหา……...
1.1 บทน า
ในโครงการพฒนาซอฟตแวรขนาดใหญทมชวงการพฒนาและชวงการบ ารงรกษาทยาวนาน นกพฒนามกจะประสบปญหาหลายประการในแงของการท างานเปนทม เชน ปญหาการท าความเขาใจพฒนาการของซอฟตแวรของนกพฒนาทเขารวมทมใหม ปญหาการเปลยนแปลงแกไขซอฟตแวรในชวงการบ ารงรกษาทอาจเกดกบทมบ ารงรกษาทไมใชทมเดยวกบทมพฒนา ปญหาการเรยกใชซอฟตแวรไลบรารทผดของนกพฒนาทเขารวมทมใหมทอาจน าไปสการเกดขอผดพลาด เปนตน ปญหาตางๆเหลานสามารถตอบสนองไดโดยการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Association Rule on Software Archives) งานวจยในอดตทศกษาการประยกตเทคนคดงกลาวมกจะใชตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) เปนตวแบบในการประเมนความนาสนใจของกฎความสมพนธ แตตวแบบคาสนบสนน-คาความเชอมนมขอบกพรองทส าคญ คอ การใหผลลพธทเปนผลบวกลวงจ านวนมาก ตอมาในปค.ศ. 2008 Liu และคณะ (Liu et al., 2008) ไดเสนอตวแบบในการประเมนความนาสนใจของกฎความสมพนธใหมขนมาและใหชอวาคาสนบสนน-คาความเชอมนใหม (Support-New confidence Model) เพอปรบปรงขอบกพรองดงกลาวของตวแบบคาสนบสนน-คาความเชอมนโดยเฉพาะ ผวจยเหนวาการน าคาสนบสนน-คาความเชอมนใหมมาประยกตใชกบการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนาจะสามารถเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรได สงผลใหนกพฒนาสามารถท างานเปนทมไดอยางมประสทธภาพมากขนดวย
งานวจยนมวตถประสงคเพอศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดวยตวแบบคาสนบสนน-คาความเชอมน ตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาใน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
2
ในนผ วจยจะน าเสนอความส าคญของปญหาในเบองตนทประกอบไปดวย ความเปนมาและความส าคญของปญหา วตถประสงคของการวจย ตวแปรทศกษา ประโยชนทคาดวาจะไดรบ ขอจ ากดของงานวจยน และนยามของศพทส าคญในงานวจยน
1.2 ความเปนมาและความส าคญของปญหา
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธเปนเทคนคหนงทไดรบความนยมและถกน าไปประยกตใชกบขอมลหลายหลากแขนง หนงในนนกคอการประยกตใชกบขอมลซอฟตแวรอารไคฟวหรอขอมลการเปลยนแปลงแกไขซอฟตแวรในอดตทไดมาจากระบบควบคมการเปลยนแปลงแกไข (Revision Control System, Version Control System) เพอประโยชนในการแกไขปญหาตางๆทเกดขนกบนกพฒนาในระหวางการพฒนาซอฟตแวร ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญถกรวบรวมเอาไวหวขอ 1.2.1 แตการตอบสนองปญหาเหลานนดวยการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในอดต เลอกใชตวแบบคาสนบสนน-คาความเชอมนเปนตวแบบในการประเมนความนาสนใจของกฎความสมพนธทงหมด ตวแบบคาสนบสนน-คาความเชอมนเปนตวแบบทไดรบความนยมมากแตในบางกรณทประยกตใชกบขอมลบางประเภทกสามารถท าใหเกดผลลพธทเปนผลบวกลวงจ านวนมากได ปญหาของคาประเมนความนาสนใจของกฎความสมพนธทอาจมผลกระทบมาถงประสทธภาพของการน าไปประยกตใชรวบรวมเอาไวในหวขอ 1.2.2 สวนการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของงานวจยในอดตรวมถงการประยกตใชกในระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรแสดงไวในหวขอ 1.2.3
1.2.1 ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญ
เปนทยอมรบกนวาโลกธรกจทางดานซอฟตแวรในปจจบนมการแขงขนสงมาก บรษททจะอยในตลาดไดจ าเปนอยางยงทจะตองมเงนทน บคคลากรและกลยทธทนาสนใจ ฉะนนการสรางความไดเปรยบทางการแขงขนจ าเปนตองมกลยทธดานกระบวนการทมประสทธภาพและมมาตรฐานเปนทยอมรบในระดบสากล เพอใหการผลตซอฟตแวรมคณภาพ ตอบสนองความ
3
ตองการและสรางความพงพอใจสงสดตอลกคา มาตรฐานซเอมเอมไอ (CMMI, Capability Maturity Model Integration) เปนตวแบบของการวดระดบวฒภาวะ (Maturity) ความสามารถในการท างานของบรษท มาตรฐานซเอมเอมไอทใชในปจจบนคอเวอรชน 2.1 ระดบวฒภาวะของมาตรฐานซเอมเอมไอมทงหมด 5 ระดบระดบวฒภาวะทงหมดประกอบดวยกลมกระบวน 22 กลมกระบวนการ ในการบรรลระดบวฒภาวะท 2 ของมาตรฐานซเอมเอมไอ บรษทจ าเปนตองบรรลเปาหมายของกลมกระบวนการทงหมด 7 กลม หนงในนนคอกลมกระบวนการการจดการการตงคาองคประกอบ (CM: Configuration Management) ซงมเปาหมายเฉพาะเจาะจง (Specific Goal) ทจ าเปนตองบรรลใหได 3 เปาหมาย และ 1 ใน 3 ของเปาหมายเฉพาะเจาะจงนนคอ การตดตามและควบคมการเปลยนแปลงแกไข (Track and Control Changes) การบรรลเปาหมายขอนนนจ าเปนตองใชเครองมอทมชอวาระบบควบคมการเปลยนแปลงแกไข (Revision Control System, Version Control System) เขามาชวย (Grune et al., 2006)
ระบบควบคมการเปลยนแปลงแกไข คอ ระบบทใชในจดการการจดเกบ การคนคน การระบและการผสานการเปลยนแปลงแกไขแฟมขอมลซอรสโคดของโปรแกรมประยกต และสารสนเทศส าคญอนๆทพฒนาขนมาโดยทมอยางเปนอตโนมต ในซอฟตแวรควบคมการเปลยนแปลงแกไขนนจะมการบนทกแฟมขอมลซอรสโคดและแฟมขอมลบนทก (Log Files) ทบรรจขอมลทเกยวของกบการเปลยนแปลงแกไขอนๆ อาทเชน ซอรสโคดสวนใดทถกแกไข นกพฒนาแกไข วนเวลาบนทกเวอรชนใหมของซอรสโคด และหมายเหตของการบนทกเวอรชนใหมเปนตน แฟมขอมลซอรสโคดและแฟมขอมลบนทกทงหมดจะถกเรยกรวมกนวา ซอฟตแวร อารไคฟว (Software Archives) (Zimmermann et al., 2004; Zimmermann et al., 2005)
ระบบควบคมการเปลยนแปลงแกไขทไดรบความนยมและถกน าไปใชอยางแพรหลายกวา 2 ทศวรรษ คอ ระบบควบคมการเปลยนแปลงแกไขทมชอวา ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System) (O’Sullivan et al., 2009) ระบบคอนเคอเรนทเวอรชนถกสรางขนมาใหบรณาการรวมกบไอดอ (IDE: Integrated Development Environment) ท าใหนกพฒนาสามารถบรรลเปาหมายการตดตามและควบคมการเปลยนแปลงแกไขได ในขณะทก าลงพฒนาซอฟตแวรในขนตอนการพฒนาซอฟตแวร (Development Phase) ของวงจรชวตการพฒนาซอฟตแวร (Software Development Life Cycle) ได
ปญหาทมกจะเกดขนกบนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญทตองมการท างานเปนทมในแงของการควบคมและตดตามการเปลยนแปลงแกไขมหลายประการ เชน ปญหา
4
การเกดขนของการเชอมโยงกน (Evolution coupling) ระหวางคลาสหรอระหวางไฟลทไมสามารถดกจบไดในชวงของการออกแบบ (Design phase) (Gall et al., 1998; Bieman et al., 2003; Burch et al., 2005) ปญหาการท าความเขาใจพฒนาการของซอฟตแวร (Software Evolution) (Ball et al., 1997) ทอาจเกดกบนกพฒนาทเขารวมทมใหม ปญหาการเปลยนแปลงแกไขซอฟตแวรในชวงการบ ารงรกษา (Maintenance phase) ทอาจเกดกบทมบ ารงรกษาทไมใชทมเดยวกบทมพฒนา ปญหาการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาด (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) นอกจากปญหาตางๆขางตนแลว ในระหวางการพฒนาซอฟตแวรนนอาจท าใหเกดความตองการบางอยางเกดขนดวย เชน ความตองการน ารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองกลบมาใชใหม (Michail, 2000) ความตองการระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร (Zimmermann et al., 2004; Zimmermann et al., 2005; Methanias et al., 2009) ปญหาและความตองการทกลาวมาขางตนนสามารถตอบสนองไดโดยการน าขอมลซอฟตแวรอารไคฟว (Software Archives) ทไดมาจากระบบคอนเคอเรนทเวอรชนมาวเคราะหและสรางวธการในการแกปญหาและตอบสนองความตองการดงกลาวได ซงจะกลาวถงในหวขอท 1.2.3 ตอไป
1.2.2 ความส าคญและปญหาของกฎความสมพนธและคาประเมนความนาสนใจของกฎความสมพนธ
ทกครงทผ ใชเขาไปใชบรการเลอกซอหนงสอหรอสนคาตางๆ ภายในเวบไซตอเมซอนดอทคอม (Amazon.com) ผ ใชจะสามารถมองเหนสวนหนงของหนาเวบไซตปรากฏขอความทวา “ลกคาหลายๆคนทซอหนงสอเลมน (หรอสนคาชนน) มกจะซอหนงสอ (หรอสนคา) …ดวย” พรอมกบแสดงรายการหนงสอ (หรอสนคา) ทมกจะถกซอรวมกนดวย ขอมลสารสนเทศทเวบไซตอเมซอนดอทคอมน ามาใชเพอประโยชนในการเพมยอดขายนเปนขอมลสารสนเทศทสรางมาจากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) ทงสน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลการซอของลกคานนยงสามารถน าไปประยกตใชในการออกแบบแคตตาลอกสนคา การขายสนคาแขวน การออกแบบรายการสงเสรมการขาย การจดวางสนคาภายในราน การแบงกลมลกคาตามรปแบบของพฤตกรรมการซอสนคา เปนตน (Agrawal et al., 1994) นอกจากนนแลวในตลอดชวงทศวรรษทผานมาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนยงมบทบาททส าคญในการคนหารปแบบความสมพนธทมคณคาในขอมลประเภทอนๆอก เชน ขอมลเครอขายโทรคมนาคม
5
ขอมลการจดการความเสยง ขอมลการควบคมคลงสนคา และขอมลทางพนธกรรมของสงมชวต เปนตน (Kotsiantis et al., 2006)
แนวคดของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนถกน าเสนอขนมาครงแรกในปค.ศ. 1993 โดย Agrawal และคณะ (Agrawal et al., 1993) ตอมาในปค.ศ. 1994 Agrawal และคณะ (Agrawal et al., 1994) ไดน าเสนอขนตอนวธในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธใหมขนมาชอวาขนตอนวธอพรโอร (Apriori Algorithm) นอกจากนน Agrawal และคณะ (Agrawal et al., 1993) ยงไดน าเสนอตวแบบของการประเมนระดบความตรงประเดนหรอระดบความนาสนใจของกฎความสมพนธตวแบบแรกและดงเดมคอตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ซงใชคา 2 คาในการประเมนคอ คาสนบสนน (Support) และคาความเชอมน (Confidence) ของกฎความสมพนธ ในตวแบบคาสนบสนน-คาความเชอมนน คาสนบสนนถกใชในการคดกรองรายการทมความถสงออกมา และคาความเชอมนจะถกใชเปนคาทวดระดบความนาสนใจของกฎความสมพนธ หลงจากนนตอมามงานวจยหลายงานวจยออกมาเสนอคาประเมนคาอนๆ ทใชในการประเมนความนาสนใจของกฎความสมพนธแทนการใชคาความเชอมน ผ วจยรวบรวมงานวจยทเสนอคาประเมนความนาสนใจของกฎความสมพนธทไดรบความนยมและถกน าไปประยกตกบตางๆ อยางละเอยดไวในบทท 2 ซงสามารถสรปไดดงตารางตอไปน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมทงรายการ X และ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
6
ตารางท 1-1 แสดงตารางสรปคาประเมนความนาสนใจของกฎความสมพนธ
ชอคาประเมนฯ สมการค านวณ อางอง
คาสนบสนน (Support) Support(X Y) = P(X and Y) (Agrawal et al., 1993) คาความเชอมน (Confidence) Conf(X Y) =
(Agrawal et al., 1993)
คาคอนวคชน (Conviction) Conviction(X Y) =
(Brin et al., 1997)
คาลฟท (Lift) Lift(X Y) =
(Brin et al., 1997)
คาเลฟเวอเรจ (Leverage) Leverage(X Y) = P(X and Y) - P(X)P(Y) (Piatetsky-Shapiro et al., 1991)
คาคฟเวอเรจ (Coverage) Coverage(X Y) = P(X) (Michael., 2009) คาสหสมพนธ (Correlation) Corr(X Y) =
√ (Sheikh et al., 2004)
คาอตราสวนออดส (Odds Ratio) Odds(X Y) =
(Sheikh et al., 2004)
ตอมาปค.ศ. 2008 Liu และคณะ (Liu et al., 2008) ไดน าเสนอขอบกพรองประการหนงของการใชตวแบบคาสนบสนน-คาความเชอมนและการใชคาความเชอมนเปนคาประเมนความนาสนใจของกฎความสมพนธ โดยการยกตวอยางฐานขอมลการซอสนคาของลกคาในกรณทท าใหการใชคาความเชอมนเปนคาประเมนความนาสนใจของกฎความสมพนธมผลลพธทออกมาเปนกฎความสมพนธทมเซตรายการทมากอนมความสมพนธเชงลบกบเซตรายการทตามมา กลาวคอ ทรานแซคชนสวนใหญถามเซตรายการทมากอนมกจะไมมเซตรายการทตามมาของกฎนนนนเอง หรอกคอไดกฎความสมพนธทเปนผลบวกลวง (False Positive) นนเอง ดวยสาเหตน Liu และคณะ (Liu et al., 2008) จงไดน าเสนอคาประเมนความนาสนใจของกฎความสมพนธใหมขนมาและใหชอวาคาความเชอมนใหม (New Confidence) พรอมกบพสจนวาคาความเชอมนใหมนไมขดแยงกบคาสหสมพนธและคาความเชอมนเดมซงเปนคาสถต นอกจากนนยงไดแสดงตวอยางของฐานขอมลทรานแซคชนสมมตชดหนงขนมาเพอพสจนวาคาความเชอมนใหมสามารถลดการเกดกฎความสมพนธทเปนผลบวกลวงดวย คาความเชอมนใหมสามารถค านวณไดจากสตรดงตอไปน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P( ) คอ คาความนาจะเปนในการไมพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y
7
ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
NConf(X Y) =
–
ในงานวจยของ Liu และคณะ (Liu et al., 2008) ทไดเสนอคาความเชอมนใหมขางตนนน Liu และคณะไดท าการเปรยบเทยบความสามารถของคาความเชอมนใหมกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ ทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) โดยใชฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชน ผลของการเปรยบเทยบคอ คาความเชอมนใหมสามารถบงบอกทศของความสมพนธไดอยางถกตองและสอดคลองกบคาเลฟเวอเรจและคาสหสมพนธ แตคาความเชอมนใหมนนสามารถระบความแตกตางของความนาสนใจของกฎความสมพนธ 2 กฎความสมพนธใดๆทคาเลฟเวอเรจและคาสหสมพนธไมสามารถระบได (กลาวคอกฎความสมพนธ 2 กฎทค านวณคาคาเลฟเวอเรจหรอคาสหสมพนธไดเทากนทง 2 กฎแตคาความเชอมนใหมใหคาทแตกตางกนระหวาง 2 กฎ) สวนคาประเมนความนาสนใจของกฎความสมพนธอนๆใหคาทขดแยงกบคาสหพนธ (กลาวคอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธนนมความสมพนธเชงลบตอกนแตกลบใหคาประเมนความนาสนใจของกฎความสมพนธทสงออกมา)
จากงานวจยในอดตทท าการเสนอคาประเมนความนาสนใจของกฎความสมพนธตางๆทกลาวไปขางตน แตละคานนกแสดงคณสมบตเฉพาะตวทแตกตางกน ผลลพธของกฎความสมพนธทไดออกมากแตกตางกนออกไป ผวจยจงสนใจทจะท าการเปรยบเทยบความสามารถของแตละคาประเมนความนาสนใจของกฎความสมพนธ ผ วจยจงทบทวนและรวบรวมงานวจยทเสนอคณสมบตตางๆทคาประเมนความนาสนใจของกฎความสมพนธควรจะม และท าการเปรยบเทยบความสามารถของคาประเมนความนาสนใจของกฎความสมพนธเหลานนดวยคณสมบตทควรจะมทงหมด คณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด 16 คณสมบตอธบายอยางละเอยดไวในบทท 2 หวขอ 2.5 และสามารถสรปไดดงน
8
- คณสมบต 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) - คณสมบต 1 ขอของ Major และ Mangano (Major and Mangano, 1995)
เพมเตมจากของ Piatetsky-Shapiro และคณะ - คณสมบต 5 ขอของ Tan และคณะ (Tan et al, 2002) - คณสมบต 5 ขอของ Lenca และคณะ (Lenca et al, 2004) - คณสมบต 2 ขอของ Geng และ Hamilton (Geng and Hamilton, 2006)
คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมทงหมด 16 ขอขางตน คณสมบตทไดรบการยอมรบและถกอางองถงโดยงานวจยตางๆ (Freitas, 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) มากทสดคอคณสมบต P1 P2 และ P3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) และคณสมบต P4 ของ Major และ Mangano (Major and Mangano, 1995)
เนองจากงานวจยของ Liu และคณะในป 2008 (Liu et al., 2008) ไดท าการพสจนคณสมบตของคาความเชอมนใหมไวทงหมดเพยง 5 คณสมบตคอ คณสมบต P1 P2 P3 O1 และ O2 เทานน ดงนนผวจยจงพสจนคณสมบต P4 O3 O4 O5 Q1 Q2 Q3 S1 และ S2 ของคาความเชอมนใหมอยางละเอยดและแสดงไวในบทท 2 หวขอ 2.5 ผลของการพสจนคณสมบตของคาความเชอมนใหมแสดงไวในตารางท 2-4 ขางตน
การเปรยบเทยบในตารางท 2-4 แสดงใหเหนวาคาความเชอมนใหมมคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม 10 คณสมบตจากทงหมด 14 คณสมบตซงมากกวาคาประเมนความนาสนใจของกฎความสมพนธอนๆ โดยเฉพาะอยางยงการมคณสมบต O3 ของคาความเชอมนใหมจะท าใหการน าคาความเชอมนใหมไปใชนนจะสามารถขจดการเกดกฎความสมพนธทมเซตรายการทมากอนและเซตรายการทตามทมความสมพนธเชงลบออกไปได ผวจยจงเชอวาถาน าคาความเชอมนใหมนไปประยกตใชกบการคนหากฎความสมพนธกบขอมลประเภทตางๆรวมถงขอมลซอฟตแวรอารไควฟ แลวนาจะท าใหกฎความสมพนธทไดมาเปนกฎความสมพนธทนาสนใจและชวยลดการเกดกฎความสมพนธทเปนผลบวกลวง (False Positive) ได
9
1.2.3 ความส าคญและปญหาของการประยกตใชเทคนคการคนหากฎความ สมพนธกบขอมลซอฟตแวรอารไคฟว
ในชวงตนของการคดคนและพฒนาแนวคดการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธถกพฒนามาเพอการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคาจากฐานขอมลรายการซอสนคาขนาดใหญ ตอจากนนมาไมนานเรมมนกวจยหลายคณะน าการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธมาประยกตใชกบขอมลประเภทตางๆมากมาย หนงในนนคอ ขอมลซอฟตแวรอารไคฟว (Software Archive) ทไดจากระบบคอนเคอเรนทเวอรชนในขนตอนการพฒนาซอฟตแวร (Development Phase) ในวงจรชวตการพฒนาซอฟตแวร (Software Development Life Cycle) คณะนกวจยเหลานนน าขอมลซอฟตแวรอารไคฟวมาวเคราะหในรปแบบตางๆกนแบงตามการน าไปใช ดงตอไปน
1) การวเคราะหเพอความเขาใจพฒนาการของการพฒนาซอฟตแวร (Ball et al., 1997) 2) การวเคราะหเพอดกจบพฒนาการของการเชอมโยงกน (Gall et al.,1998; Bieman et
al., 2003; Zimmermann et al., 2004) 3) การวเคราะหเพอเปดเผยรปแบบการเรยกใชงานซอฟตแวรไลบราร (Michail, 1999;
Michail, 2000; Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) 4) การวเคราะหเพอสรางค าแนะน าในการเปลยนแปลงแกไข (Zimmermann et al.,
2005; Methanias et al., 2009)
รายละเอยดของแตละงานวจยแสดงในหวขอ 2.7 จากงานวจยทน าขอมลซอฟตแวร อารไคฟวมาวเคราะหทงหมด มคณะวจยของ Li และคณะวจยของ Livshits (Li et al., 2005; Livshits et al., 2005) ไดแสดงใหเหนวาการประยกตเทคนคการท าเหมองขอมลดวยกฎความสมพนธกบขอมลซอฟตแวรอารไคฟวเปนเทคนคทคอนขางมประสทธภาพแตในบางกรณกสามารถท าใหเกดผลลพธของการคนหาทเปนผลบวกลวง (False Positive) เปนจ านวนมากได
ในปค.ศ. 2005 Zimmermann และคณะ (Zimmermann et al., 2005) ไดเสนอการประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวร อารไคฟวอกรปแบบหนง คอการสรางค าแนะน าในการเปลยนแปลงแกไขใหกบนกพฒนาในระหวางขนตอนการพฒนาซอฟตแวร ในงานวจยน Zimmermann และคณะเสนอวาระบบสราง
10
ค าแนะน านกพฒนานนควรจะสามารถใหค าแนะน าแกนกพฒนาทงหมด 3 สถานการณคอ 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไป 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนน และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะไมควรใหค าแนะน าทเปนผลบวกลวง (False Positive) ออกมาแกนกพฒนา งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดท าการทดสอบประสทธภาพของการใหค าแนะน าในรปแบบตางๆหลายรปแบบกบขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรแบบโอเพนซอรส (Open Source) และขอสรปของการทดสอบไดแนะน าสงทเปนประโยชนตอการตอยอดการประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวไดเปนอยางด เชน การใหค าแนะน าในระดบเอนทตละเอยด (ตวแปร เมธอดหรอฟงกชน) ใหประสทธภาพไมตางกบการใหค าแนะน าในแฟมขอมลหรอคลาส การใหค าแนะน านกพฒนามประสทธภาพมากส าหรบการเปลยนแปลงแกไขในชวงการบ ารงรกษา (Maintenance Phase) (เนนทการแกไข (alter) มากกวาการเพม (add to) กบการลบ (delete from)) เปนตน นอกจากนนผ วจยสงเกตเหนวาผลการทดสอบประสทธภาพในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ยงใหประสทธภาพไมสงเทาทควร
จากความส าคญและปญหาทกลาวไปทงหมดในหวขอ 1.2.1 ถง 1.2.3 ขางตนผวจยเหนวาการเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของ ไอดอนนควรเพมประสทธภาพโดยการปรบปรงขนตอนวธในการคนหากฎความสมพนธใหดขนและลดจ านวนของการเกดผลบวกลวงลง ผ วจยจงคาดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) นนนาจะมประสทธภาพทดกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความ
11
เชอมนเดมจากการแสดงคณสมบตทคาประเมนความนาสนใจควรจะมมากทสดและโดยเฉพาะอยางยงการแสดงคณสมบต O3
โดยทวไปแลวระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอจะท าหนาทหลก 2 ประการคอ 1) การชน านกพฒนาวาควรเปลยนแปลงแกไขสวนใดตอเมอมการเปลยนแปลงแกไขสวนนแลว และ 2) การแจงเตอนนกพฒนากอนการบนทกวายงท าการแกไขเปลยนแปลงไมสมบรณเพอปองกนการเกดขอผดพลาด (error) นอกจากหนาท 2 ประการนแลวสงทส าคญอกประการหนงคอระบบใหค าแนะน าตองไมมการใหค าแนะน าใดๆออกมาถาการเปลยนแปลงแกไขทงหมดสมบรณดแลวดวย (Zimmermann et al., 2005) ดงนนในการทดสอบประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอควรทดสอบสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
ดงนนผ วจยจงตองการศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณ
1.3 วตถประสงคของงานวจย
1. เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) โดยทประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบ
12
ขอมลซอฟตแวรอารไคฟวนนสามารถแบงออกไดเปนประสทธภาพใน 3 สถานการณของการพฒนาซอฟตแวรดงน
- สถานการณการน าทาง (Navigation) - สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) - สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
1.4 ขนตอนโดยสรปของการท าวจย
1. ศกษารายละเอยดเกยวกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทมอยในปจจบน
2. ศกษารายละเอยดเกยวกบการประเมนระดบความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules) ในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) และตวแบบตางๆทมอยในปจจบน
3. ออกแบบเครองมอทดสอบตางๆตามทไดศกษา 4. พฒนาเครองมอทดสอบตามทไดออกแบบไว 5. ทดสอบการท างานของเครองมอทพฒนา 6. ประเมนการท างานของเครองมอ 7. วเคราะหผลการทดลองและส ารวจขอมลเพมจากผลการทดลอง 8. จดท าเอกสารสรปงานวจย และขอเสนอแนะ
1.5 ตวแปรทศกษา
1. ตวแปรอสระ (Independent variables)
งานวจยนสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร
13
ของไอดอ (IDE: Integrated Development Environment) ไดหรอไม ดงนนตวแปรตนของการศกษานกคอตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ ซงงานวจยนจะศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทงหมด 2 ตวแบบ ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน -คาความเชอมน (Support-Confidence Model)
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Support-New Confidence Model) (Liu et al., 2008)
โดยในงานวจยนจะเปรยบเทยบประสทธภาพของทง 2 ตวแบบขางตนในสถานการณทตางกน 3 สถานการณ คอ สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) เชนเดยวกบงานวจยของ Zimmermann และคณะในป ค.ศ. 2005 (Zimmermann et al., 2005) และงานวจยของ Methanias และคณะในป ค.ศ. 2009 (Methanias et al., 2009)
2. ตวแปรตาม (Dependent variables)
ตวแปรตามของงานวจยน คอ ประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ การเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะพจารณาจากค าแนะน าส าหรบนกพฒนาทถกสรางมาจากกฎความสมพนธทไดมานนมความถกตองแมนย าในการท านายและใหค าแนะน าในระหวางการพฒนาซอฟตแวรมากนอยเพยงใด โดยการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในแตละสถานการณมวธการในการประเมนทแตกตางกนออกไปดงน
ในสถานการณ การน าทาง (Navigation) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) (Methanias et al., 2009) รายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวย
14
เทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การปองกนการเกดขอผดพลาด (Error Prevention) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) (Methanias et al., 2009) รายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การเปลยนแปลงแกไขทสมบรณแลว (Closure) สามารถประเมนประสทธภาพจากคาผลสะทอนกลบ (Feedback) (Zimmermann et al., 2005; Methanias et al., 2009) รายละเอยดและวธการค านวณคาผลสะทอนกลบส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
3. ตวแปรควบคม
ตวแปรควบคมกบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว มทงหมด 2 ตวแปร ไดแก
1) ขอสอบถาม ส าหรบงานวจยน คอ เซตทประกอบไปดวยเซตเหตการณการเปลยนแปลงแกไขและเซตผลลพธทคาดไว โดยจะมขอสอบถามทงหมด 3 แบบส าหรบ 3 สถานการณทแตกตางกนคอสถานการณการน าทาง สถานการณการปองกนขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Zimmermann et al., 2005; Methanias et al., 2009)
2) เครองมอทใชในงานวจย ประกอบดวยเครองมอทงหมด 5 เครองมอไดแก เครองมอจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว เครองมอสรางขอสอบถามส าหรบการทดสอบ 3 สถานการณ เครองมอการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบ 3 สถานการณ เครองมอสรางเซตของค าแนะน าส าหรบเหตการณ และเครองมอประเมนผลการทดสอบ
15
1.6 ขอบเขตของการวจย
1. ขอมลซอฟตแวรอารไคฟวทน ามาใชในการศกษาเปนขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทพฒนาดวยภาษาซพลสพลส (C++) เทานน
2. ขอมลซอฟตแวรอารไคฟวทน ามาใชในการศกษาเปนขอมลซอฟตแวรอารไคฟวทมาจากซอฟตแวรควบคมการแกไขปรบปรง (Revision Control) ทชอวาระบบคอนเคอเรนทเวอรชน (Concurrent Version System) เทานน
3. ค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรในงานวจยน หมายถง ค าแนะน าทไดมาจากการคนหารปแบบของการเปลยนแปลงแกไขในการพฒนาซอฟตแวรทเกดขนบอยในอดตเทานน ไมรวมถงรปแบบของการเปลยนแปลงแกไขทเกดขนไมบอยแตมความส าคญมาก
4. ค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรในงานวจยน สนใจเพยงการเปลยนแปลงแกไขทควรจะอยในทรานแซคชนเดยวกนเทานน ไมสนใจล าดบของการเปลยนแปลงแกไข
5. ทรานแซคชนของการเปลยนแปลงแกไขทน ามาทดสอบในงานวจยน ไมรวม ทรานแซคชนทถกระบวาเปนสงแปลกปลอม 2 ประเภทคอ ทรานแซคชนขนาดใหญและทรานแซคชนการผสานกง
6. ทรานแซคชนของการเปลยนแปลงแกไขทน ามาทดสอบในงานวจยน คอ ทรานแซคชนของการเปลยนแปลงแกไขในระดบของแฟมขอมลและคลาสเทานน ไมไดพจารณาถงการเปลยนแปลงแกไขในระดบเอนทตทละเอยดเชน เมธอดหรอตวแปร
7. การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 3 สถานการณแยกจากกน แตใช ทรานแซคชนชดทดสอบชดเดยวกนทง 3 สถานการณ
8. การทดสอบของงานวจยนเลอกตวอยางขอมลซอฟตแวรอารไคฟวเพยงตวอยางเดยว เนองจากงานวจยนตองการวจยเพอหาขอมลเบองตน (Exploratory Research) เทานน
16
1.7 ประโยชนทคาดวาจะไดรบ
1. ผ ทตองการพฒนาระบบใหค าแนะน าส าหรบนกพฒนาระหวางการพฒนาซอฟตแวรบนไอดอ สามารถน างานวจยนไปเปนแนวทางในการประยกตใชเขากบไอดอได
2. ผ ทตองการพฒนาระบบตดตามพฒนาการการเกดความเชอมโยงกน (Evolution Coupling) สามารถน างานวจยนไปเปนแนวทางในการประยกตใชได
3. ผ ทตองการพฒนาระบบคนหารปแบบการเรยกใชงานไลบราร (Software Library Call Pattern) สามารถน างานวจยนไปเปนแนวทางในการประยกตใชได
4. ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยน ท าใหทราบตวแบบทเหมาะส าห รบการ คนหากฎความสมพน ธ ใน สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) ในการพฒนาซอฟตแวรได
5. ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนเปนประโยชนส าหรบนกวจยทตองการตอยอดศกษาการประยกตใชกฎความสมพนธกบระบบใหค าแนะน าส าหรบนกพฒนาระหวางการพฒนาซอฟตแวรตอไป
1.8 นยามศพท
1. ซอฟตแวรอารไคฟว (Software Archives) คอ แฟมขอมลซอรสโคด (Source Code Files) ทกเวอรชน และแฟมขอมลบนทกทไดจากระบบควบคมการพฒนาเวอรชน (CVS Log File)
2. ซอรสโคด (Source Code) คอ รหสคอมพวเตอรซงไดรบการเปลยนเปนภาษาทางเครองคอมพวเตอรกอนท างานบนเครองคอมพวเตอร
17
3. เอนทต (Entity) คอ เอกลกษณหรอสงทผ วจยสนใจศกษา ในทนค าวา เอนทต สามารถหมายถง แฟมขอมลเอกสาร (File) คลาส (Class) เมธอดหรอฟงกชน (Method or Function) และตวแปร (Variable)
4. การเปลยนแปลงแกไข (Changes) คอ การทมนกพฒนาแกไขเอนทตใดๆ ค าวา การเปลยนแปลงแกไขในทนสามารถแสดงได 3 มต คอ 1) การแกไขเอนทต (alter) 2) การเพมลงในเอนทต (add to) และ 3) การลบออกจากเอนทต (delete from)
5. ทรานแซคชน (Transaction) ส าหรบงานวจยน คอ เซตของการเปลยนแปลงแกไขทเกดขนพรอมกนหรอในเวลาใกลเคยงกนและถกบนทกเขาสระบบคอนเคอเรนทเวอรชนโดยนกพฒนาคนเดยวกน
6. เหตการณ (Situation) คอเซตของการเปลยนแปลงแกไขใดๆ ทเกดขนจากนกพฒนา
7. กฎความสมพนธ (Association Rules) สามารถนยามไดดงน ก าหนดให เซต I = {i1, i2, ... ,im} เปนเซตของรายการขอมล (items) ทมอยทงหมดและให เซต T = {t1, t2, ... ,tn} เปนเซตของทรานแซคชน โดยทแตละทรานแซคชน tn ประกอบดวยเซตยอย Ij (j = 1, 2, .. m) ทเปนเซตยอยของเซตของรายการขอมล I เซตของรายการขอมล Ij นนถกเรยกวา เซตรายการ (Itemset) ดงนนกฎความสมพนธ r กคอคของเซตรายการ I1 และเซตรายการ I2 โดยทเซตรายการ I1 และเซตรายการ I2 เปนเซตยอยของเซต I ทไมมสมาชกทซอนทบกนและเซตรายการ I2 ไมเทากบเซตวาง เซตรายการ I1 ถกเรยกวา เซตรายการทมากอน (Antecedent Itemset) และเซตรายการ I2 ถกเรยกวา เซตรายการทตามมา (Consequent Itemset) และก าหนดสญลกษณ I1 I2 แทนกฎความสมพนธ R ทมเซตรายการ I1 เปนเซตรายการทมากอน และเซตรายการ I2 เปนเซตรายการทตามมา โดยท I2 ไมใชเซตวาง (Olivier et al., 2008) ส าหรบงานวจยน กฎความสมพนธ คอ กฎความสมพนธทตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดดวยตอไป (Zimmermann et al., 2005; Methanias et al., 2009)
18
8. ค าแนะน าส าหรบเหตการณ Q (Suggestions for Situation Q) คอ เซตของการเปลยนแปลงแกไขทนกพฒนาควรจะท าตามหลงจากทนกพฒนาไดเปลยนแปลงแกไขตามเหตการณ Q โดยอางองมาจากเซตของกฎความสมพนธทมเซตรายการทมากอนเปนเซตเหตการณ Q (Zimmermann et al., 2005)
9. สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะตองใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไป (Zimmermann et al., 2005; Methanias et al., 2009)
10. สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะตองใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนได (Zimmermann et al., 2005; Methanias et al., 2009)
11. สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนอยางครบถวนแลว ระบบจะตองไมใหค าแนะน าแกไขเอนทตใดๆกบนกพฒนา (Zimmermann et al., 2005; Methanias et al., 2009)
12. ไอดอ (IDE: Integrated Development Environment) คอ โปรแกรมประยกตทจดเตรยมสงแวดลอมซงอ านวยความสะดวกใหแกนกพฒนาซอฟตแวร โดยปกตแลวประกอบดวย เครองมอพฒนาซอรสโคด (Source Code Editor) ตวแปลภาษาคอมพวเตอร (Compiler) หรอ ตวแปลค าสงคอมพวเตอร ( interpreter) หรอทงสอง เครองมอสรางระบบอตโนมต (Build Automation Tools) และเครองมอตรวจแกขอผดพลาด (Debugger) เปนพนฐาน
19
บทท 2 ทบทวนวรรณกรรมทเกยวของ……..
2.1 บทน า
วรรณกรรมทเกยวของกบงานวจยนถกเรยบเรยงไวตามล าดบ เรมตนจากแนวคดของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) รวมถงคาทใชในการประเมนความนาสนใจของกฎความสมพนธ ( Interestingness Measure of Association Rules) ทมงานวจยในอดตเคยเสนอไวทงหมด 8 คา ตอมาจะอธบายถงตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม โดยเรมจากการอธบายถงขอบกพรองของตวแบบคาสนบสนน-คาความเชอมนดงเดม ตามดวยการอธบายตวแบบการประเมนความนาสนใจของกฎความสมพนธแบบใหม และตอดวยการอธบายคณสมบตทคาประเมนความนาสนใจควรจะมทงหมด 16 คณสมบต รวมถงสรปคณสมบตทคาประเมนความนาสนใจทง 8 คาและคาความเชอมนใหมม หวขอถดมาเปนการอธบายแนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) รวมถงระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ซงเปนระบบทผวจยสนใจน าขอมลมาท าการทดสอบ หวขอถดมาเปนการรวบรวมวรรณกรรมทเกยวของกบการประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive) ตงแตอดตจนถงปจจบน รวมถงอธบายถงขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ของงานวจยตางๆในอดตอยางละเอยด ตงแตการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) จนถงขนตอนการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) และขนตอนการสรางค าแนะน าจากกฎความสมพนธ (Generating Suggestions for Situation) สดทายจะกลาวถงการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
20
2.2 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery)
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules discovery) คอการคนหาความสมพนธทมความเกยวของและเชอมโยงกนระหวางรายการขอมล (Data Items) ภายในฐานขอมลขนาดใหญทมอยเพอน าไปใชในการวเคราะหหรอท านายปรากฏการณตางๆ (Agrawal et al., 1993) ตวอยางในการน ากฎความสมพนธไปประยกตใชในทางปฏบตทไดรบความนยมมากทสดคอ การวเคราะหพฤตกรรมการซอของลกคา (Market Basket Analysis)
นยามทางคณตศาสตรของการคนหากฎความสมพนธนนสามารถอธบายไดดงน ก าหนดให เซต I = {i1, i2, ... ,im} เปนเซตของรายการขอมล (items) ทมอยทงหมดและให เซต T = {t1, t2, ... ,tn} เปนเซตของทรานแซคชน โดยทแตละทรานแซคชน tn ประกอบดวยเซตยอย Ij (j = 1, 2, .. m) ทเปนเซตยอยของเซตของรายการขอมล I เซตของรายการขอมล Ij นนถกเรยกวา เซตรายการ (Itemset) ดงนนกฎความสมพนธ r กคอคของเซตรายการ I1 และเซตรายการ I2 โดยทเซตรายการ I1 และเซตรายการ I2 เปนเซตยอยของเซต I ทไมมสมาชกทซอนทบกนและเซตรายการ I2 ไมเทากบเซตวาง เซตรายการ I1 ถกเรยกวา เซตรายการทมากอน (Antecedent Itemset) และเซตรายการ I2 ถกเรยกวา เซตรายการทตามมา (Consequent Itemset) และก าหนดสญลกษณ I1 I2 แทนกฎความสมพนธทมเซตรายการ I1 เปนเซตรายการทมากอน และเซตรายการ I2 เปนเซตรายการทตามมา โดยท I2 ไมใชเซตวาง (Olivier et al., 2008)
วธการทดวธหนงทจะระบวากฎความสมพนธนนๆมความตรงประเดนมากนอยเพยงใด คอการก าหนดคาทใชในการประเมนคณภาพของกฎความสมพนธหรอทเรยกวาคาประเมนความนาสนใจของกฎความสมพนธ ตวแบบของการประเมนความนาสนใจของกฎความสมพนธทเปนตวแบบแรกและดงเดมคอตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ซงใชคา 2 คาในการประเมน คาแรกถกเรยกวาคาสนบสนน (Support) ของกฎความสมพนธ ใชสญลกษณ Support(I1 I2) คาสนบสนนนสามารถค านวณไดจากจ านวนของทรานแซคชนทมทงสวนเซตรายการทมากอน (I1) และเซตรายการทตามมา (I2) ของกฎความสมพนธหารดวยจ านวนของทรานแซคชนทงหมด ซงคาสนบสนนนกคอคาความนาจะเปนทจะมทรานแซคชนทมทงรายการในเซตรายการทมากอนและเซตรายการทตามมาในทรานแซคชนทงหมดนนเอง ในบางครงคาสนบสนนของกฎความสมพนธนนอาจถกน าไปใชในรปรอยละของจ านวนทรานแซคชน
21
ทงหมด คาสนบสนนถกใชในการประเมนความถ (Frequent) ในการปรากฏของรายการ (Item) หรอเซตรายการ หรอกฎความสมพนธ นอกจากการพจารณาคาสนบสนนของกฎความสมพนธกคอการพจารณาคาความเชอมน (Confidence) ของกฎความสมพนธ ใชสญลกษณ Conf(I1 I2)) คาความเชอมนนกคออตราสวนของคาสนบสนนของกฎความสมพนธกบคาสนบสนนของเซตรายการทมากอน หรออาจเรยกไดวาคาความเชอมน กคอคาความนาจะเปนทจะมรายการทกรายการในเซตรายการทมากอนแลวจะมรายการทกรายการในเซตรายการทตามมาดวย คาความเชอมนนนถกน าไปใชในการประเมนระดบความนาสนใจของกฎความสมพนธ
นอกจากตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) แลวการประเมนระดบความนาสนใจของกฎความสมพนธยงสามารถใชวธการอนๆได ซงถกรวบรวมเอาไวและอธบายอยางละเอยดในหวขอถดไป
2.3 การประเมนความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules)
หวขอนไดรวบรวมวรรณกรรมตางๆทเกยวของกบการเสนอตวแบบทน ามาใชในการประเมนความนาสนใจของกฎความสมพนธตงแตในอดตจนถงในปจจบนอนไดแก คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คา เลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) ตามล าดบ รวมถงวรรณกรรมทมการสนบสนนตวแบบขางตนและวรรณกรรมทพสจนขอบกพรองของตวแบบบางตวดวย เพอใหงายตอการเปรยบเทยบกนของทกตวแบบทนยามขนมาจากคาทางสถตจงก าหนดนยามคาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมลดงน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล n(X) คอ จ านวนของทรานแซคชนทมรายการ X ปรากฏอย
N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
P(X) =
22
2.3.1 คาสนบสนน (Support)
คาสนบสนนถกน าเสนอขนมาครงแรกโดย Agrawal และคณะในปค.ศ. 1993 (Agrawal et al., 1993) คาสนบสนนคอคาความนาจะเปนของรายการนนนนเอง โดยปกตคาสนบสนนนนเปนคาทถกใชในการแสดงความถในการปรากฎของแตละรายการ แตคาสนบสนนนกสามารถน ามาใชในการประเมนความนาสนใจของกฎความสมพนธได สมการในการค านวณคาสนบสนนของรายการ X แสดงไดดงน
ก าหนดให Support(X) คอ คาสนบสนนของรายการ X P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล
Support(X) = P(X)
การหาคาสนบสนนของรายการหรอบางทกถกเรยกวาคาความถของรายการ เซตรายการทมคาสนบสนนมากกวาคาสนบสนนขนต าทก าหนดไวจะเรยกเซตรายการนนวาเซตรายการความถสง (Frequent Itemset) หรอเซตรายการใหญ (large Itemset) หรอกลาวคอคาสนบสนนน จะถกน ามาใชเพอเปนการคดกรองรายการทงหมดในฐานขอมลใหเหลอแตเพยงรายการทมความถสงตามทก าหนดไวเพอน าเซตรายการเหลานนไปคนหากฎความสมพนธในภายหลง
ในกรณทจะใชคาสนบสนนมาประเมนระดบความนาสนใจ กคอคาความถของกฎความสมพนธนนนนเอง สมการในการค านวณคาสนบสนนของกฎความสมพนธ แสดงไดดงน
ก าหนดให Support(R) คอ คาสนบสนนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ Y ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ใน
ฐานขอมล
23
Support(X Y) = P(X and Y)
ขอเสยของการใชคาสนบสนนกคอการกอใหเกดปญหาขาดแคลนรายการ (rare item problem) เนองจากบางรายการนนเปนรายการทปรากฏอยในฐานขอมลจ านวนนอยจงถกคดออกไป แตในความจรงนนรายการทปรากฏอยในฐานขอมลจ านวนนอยอาจสามารถน าไปสรางเปนกฎความสมพนธทนาสนใจหรอมคณคาได คาทเปนไปไดของคาสนบสนนนนอยในพสย [0, 1] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาสนบสนนจะเทากบ 0 ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาสนบสนนจะเทากบ 1 (Agrawal et al., 1993; Sheikh et al., 2004)
2.3.2 คาความเชอมน (Confidence)
คาความเชอมนถกน าเสนอขนมาครงแรกโดย Agrawal และคณะในปค.ศ. 1993 (Agrawal et al., 1993) เชนเดยวกบคาสนบสนนนยามของคาความเชอมนคอความนาจะเปนทจะพบกฎความสมพนธ X Y ในทรานแซคชนทมรายการ X ปรากฏอย ดงนนการค านวณคาความเชอมนของกฎความสมพนธ X Y และกฎความสมพนธ Y X นนจะใหคาทแตกตางกน สมการในการค านวณคาความเชอมนแสดงไดดงน
ก าหนดให Conf(R) คอ คาความเชอมนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
P(Y|X) คอ คาความนาจะเปนในการพบรายการ Y ในทรานแซคชนทมรายการ X อยแลว
Conf(X Y) =
หรอ Conf(X Y) = P(Y|X)
เนองจากคาความเชอมนและคาสนบสนนนนถกพฒนาขนมาพรอมกนโดย Agrawal และคณะ คาสนบสนนจะถกน ามาใชเพอเปนการคดกรองรายการทงหมดในฐานขอมลใหเหลอแตเพยงรายการทมความถสงตามทก าหนดไว ตอจากนนคาความเชอมนจะถกน ามาใชในการสรางกฎ
24
ความสมพนธขนมาจากผลลพธเซตรายการทมความถสงทไดมาจากการหาคาสนบสนนโดยการค านวณหาคาความเชอมนของทกกฎความสมพนธทเปนไปไดจากเซตรายการทมความถสงทงหมด คาความเชอมนของกฎความสมพนธใดทมากกวาคาความเชอมนขนต า (Minimum Confidence) ทก าหนดไวจะถอวากฎความสมพนธนนมอยจรงและมความนาสนใจ
ปญหาทเกดขนจากการใชคาความเชอมนคอคาความเชอมนนนคอนขางจะออนไหวงายตอความถของเซตรายการทตามมา กลาวคอถากฎความสมพนธนนมเซตรายการทตามมาทมความถสงมาก (ในขณะทเซตรายการทมากอนมความถทนอยกวามาก) จะท าใหคาความเชอมนของกฎความสมพนธมคาสงสงผลใหกฎความสมพนธนนถกพจารณาวามความนาสนใจ ซงในความจรงเซตรายการทมากอนและเซตรายการทตามมาอาจมความสมพนธกนนอยมากกได (Sheikh et al., 2004) คาทเปนไปไดของคาความเชอมนนนอยในพสย [0, 1] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาความเชอมนจะเทากบ 0 ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาความเชอมนจะเทากบ 1 (Agrawal et al., 1993; Sheikh et al., 2004)
2.3.3 คาคอนวคชน (Conviction)
คาคอนวคชนถกเสนอขนมาครงแรกโดย Brin และคณะในปค.ศ. 1997 (Brin et al., 1997) คาคอนวคชนถกพฒนาขนมาเพอแกไขขอดอยของคาความเชอมนทไมสามารถจะบงบอกทศของกฎความสมพนธไดภายในการค านวณครงเดยว กลาวคอการใชคาความเชอมนจะตองมการค านวณทงคาความเชอมนของกฎความสมพนธทงไปและกลบเพอเลอกกฎความสมพนธทมคาคาความเชอมนสงกวากน คาคอนวคชนของกฎความสมพนธ X Y นนจะเปรยบเทยบความนาจะเปนในการมรายการ X ปรากฏโดยทไมมรายการ Y ปรากฏ สมการในการค านวณคาคอนวคชนแสดงไดดงน
ก าหนดให Conviction(R) คอ คาคอนวคชนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ใน
ฐานขอมล P(X and ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมม
25
รายการ Y ในฐานขอมล
Conviction(X Y) =
โดยท P( ) คอความนาจะเปนทไมมรายการ Y ปรากฏในทรานแซคชน คาทเปนไปไดของ
คาคอนวคชนนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาคอนวคชนจะเทากบ 1 แตถาเซตรายการทมากอนและเซต
รายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาคอนวคชนจะเทากบ + (Brin et al., 1997; Sheikh et al., 2004)
2.3.4 คาลฟท (Lift)
คาลฟทถกเสนอขนมาครงแรกโดย Brin และคณะในปค.ศ. 1997 (Brin et al., 1997) คาลฟทนนเปนคาทใชในการประเมนความถในการปรากฏรวมกนของเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธโดยทเซตรายการทมากอนและเซตรายการทตามมานนเปนอสระตอกนทางสถต ขอดประการหนงของการค านวณคาลฟทคอการใชคาลฟทจะไมพบกบปญหาขาดแคลนรายการ สมการในการค านวณคาลฟทแสดงไดดงน
ก าหนดให Lift(R) คอ คาลฟทของกฎความสมพนธ R
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y ในฐานขอมล
P(Y|X) คอ คาความนาจะเปนในการพบรายการ Y ในทรานแซคชนทมรายการ X อยแลว
Conf(R) คอ คาความเชอมนของกฎความสมพนธ R
Lift(X Y) =
หรอ Lift(X Y) =
26
หรอ Lift(X Y) =
คาทเปนไปไดของคาลฟทนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาลฟทจะเทากบ 1 ถาคาลฟทมคามากกวา 1 หมายถงเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกตอกน ถาคาลฟทมคานอยกวา 1 หมายถงเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงลบตอกน (Brin et al., 1997; Sheikh et al., 2004)
2.3.5 คาเลฟเวอเรจ (Leverage)
คาเลฟเวอเรจถกเสนอขนมาครงแรกโดย Piatetsky-Shapiro และคณะในป 1991 (Piatetsky-Shapiro et al., 1991) คาเลฟเวอเรจถกพฒนาขนมาเพอประเมนความตางของคาความนาจะเปนของการปรากฏเซตรายการทมากอนและเซตรายการทตามมาขนพรอมกนโดยทเซตรายการทงสองนนมการขนตอกนทางสถตกบคาความนาจะเปนของการปรากฏเซตรายการทมากอนและเซตรายการทตามมาทปรากฏอยางเปนอสระตอกนในฐานขอมล สมการในการค านวณคาเลฟเวอเรจแสดงไดดงน
ก าหนดให Leverage(R) คอ คาเลฟเวอเรจของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล
Leverage(X Y) = P(X and Y) - P(X)P(Y)
เหตผลส าคญทมการพฒนาคาเลฟเวอเรจขนมานนมาจากความตองการตงวธการขายสนคา โดยท าการคนหาวาการขายสนคาทงสองเซตรายการรวมกนกบการขายทเปนอสระตอกนแบบไหนมคามากกวากน ขอดอยส าคญของคาเลฟเวอเรจกคอการใชคานอาจท าใหประสบกบ
ปญหาขาดแคลนรายการได คาทเปนไปไดของคาเลฟเวอเรจนนอยในพสย [- , + ] (Piatetsky-Shapiro et al., 1991; Sheikh et al., 2004)
27
2.3.6 คาคฟเวอเรจ (Coverage)
คาคฟเวอเรจคอคาสนบสนนของเซตรายการทมากอน หรอ คาความนาจะเปนในการพบทรานแซคชนทมรายการทมากอนในฐานขอมลนนเอง แนวคดของคาคฟเวอเรจคอการใชความถของเซตรายการทมากอนของกฎความสมพนธมาใชเปนตวระบถงความนาสนใจของกฎความสมพนธนน สมการในการค านวณคาคฟเวอเรจแสดงไดดงน
ก าหนดให Coverage (R) คอ คาคฟเวอเรจของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล
Coverage(X Y) = P(X)
คาทเปนไปไดของคาคฟเวอเรจนนอยในพสย [0, 1] (Michael., 2009)
2.3.7 คาสหสมพนธ (Correlation)
คาสหสมพนธหรอคาสหสมพนธนเปนเทคนคทางสถตทสามารถแสดงไดวาเซตรายการใดมความสมพนธกนอยางแขงแรง สมการในการค านวณคาสหสมพนธแสดงไดดงน
ก าหนดให Corr(R) คอ คาสหสมพนธของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล
Corr(X Y) =
√
คาสหสมพนธนสามารถน ามาใชประเมนลกษณะของความสมพนธระหวางเซตรายการทมากอนและเซตรายการทตามมาได คาทเปนไปไดของคาสหสมพนธนนอยในพสย [-1, 1] โดยทคาสหสมพนธทเปนคาลบ หมายถง เซตรายการทงสองแปรผกผนกน ถาคาสหสมพนธเทา -1 จะหมายถงเซตรายการทงสองแปรผกผนกนอยางสมบรณ คาสหสมพนธทเปนคาบวก หมายถง เซต
28
รายการทงสองแปรตามกน ถาคาสหสมพนธเทา 1 จะหมายถงเซตรายการทงสองแปรผกตามกนอยางสมบรณ และถาคาสหสมพนธเปน 0 หมายถงเซตรายการทงสองไมมความสมพนธตอกนเลย (Sheikh et al., 2004)
2.3.8 คาอตราสวนออดส (Odds Ratio)
คาอตราสวนออดส คอคาประเมนทางสถตทค านวณหาความสมพนธระหวางตวแปร 2 ตวทแตละตวเปนตวแปรจดกลมทแบงออกเปน 2 กลม แนวคดของออดสมาจากการเสยงโชค (gambling) ตวอยางเชน ออดสของมาทจะแขงชนะเปน 3 : 1 หมายถงความนาจะเปนทมาจะชนะ 3 คร งตอการไมชนะ 1 ครง เ มอน าคาทางสถตนมาประยกตใชกบการประเมนกฎความสมพนธจะไดวา คาอตราสวนออดส คออตราสวนระหวางออดสของเหตการณทมเซตรายการทมากอนและเซตรายการทตามมาปรากฏหรอไมปรากฏทงคกบออดสของเหตการณทมเซตรายการทมากอนปรากฏแตเซตรายการทตามมาไมปรากฏหรอเหตการณทไมมเซตรายการทมากอนปรากฏแตมเซตรายการทตามมาปรากฏ โดยคาอตราสวนออดส มสตรค านวณดงน สมการในการค านวณคาคอนวคชนแสดงไดดงน
ก าหนดให Odds(R) คอ คาอตราสวนออดสของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X และ
รายการ Y ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไม
รายการ Y ในฐานขอมล
Odds(X Y) =
29
คาทเปนไปไดของคาอตราสวนออดสนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาอตราสวนออดสจะเทากบ 0 กฎ
ความสมพนธทมความนาสนใจมากจะมคาอตราสวนออดสเทากบ + (Sheikh et al., 2004)
2.4 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม
การคนหากฎความสมพนธนนจดเปนหนงในงานทส าคญและไดรบความนยมมากในการท าเหมองขอมล ตวแบบดงเดมทใชในประเมนในการคนหากฎความสมพนธนนกคอตวแบบคาสนบสนน-คาความเชอมน ทไดกลาวไปแลวในขางตน ตวแบบคาสนบสนน-คาความเชอมนนจะใชการประเมนคาความเชอมนเปนตวชวดระดบความนาสนใจของกฎความสมพนธ การประเมนความนาสนใจของกฎความสมพนธดวยวธแบบดงเดมนมขอบกพรองอยหลายประการซงจะอธบายขอบกพรองเหลานอยางละเอยดในหวขอ 2.4.1 ตอจากนนจะกลาวถงตวแบบการประเมนความนาสนใจของกฎความสมพนธทเสนอโดย Liu และคณะในป 2008 (Liu et al., 2008) ในงานวจยนผ วจยจะเรยกตวแบบใหมดงกลาวนวา ตวแบบคาสนบสนน -คาความเชอมนใหม (Support-New Confidence Model) ของ Liu และคณะ (Liu et al., 2008)
2.4.1 ขอบกพรองของตวแบบคาสนบสนน-คาความเชอมน
การท าเหมองขอมลของกฎความสมพนธโดยใชตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) นนคาทใชในการประเมนความนาสนใจของกฎความสมพนธ X Y กคอคาความเชอมนของกฎความสมพนธ (Conf(X Y)) แตในบางครงการท าเหมองขอมลของกฎความสมพนธโดยตวแบบนอาจจะท าใหไดรบกฎความสมพนธทไมมความเกยวของกนจรงและอาจน าไปสการก าหนดกฎความสมพนธทผดหรอเปนผลบวกลวง (False Positive) ได การน าตวแบบคาสนบสนน-คาความเชอมนไปใชงานจงมขอจ ากดดงแสดงในตวอยางตอไปน
ตวอยางท 1 ก าหนดใหตารางดานลางนเปนตารางแสดงทรานแซคชนอยางงาย แตละแถวแทนรายการตางๆในทรานแซคชน แตละหลกแทนทรานแซคชน 1 ทรานแซคชน จ านวนทรานแซคชนทงหมดทแสดงในตารางคอ 8 ทรานแซคชนคอทรานแซคชน T1-T8 มรายการทงหมด 3 รายการคอ รายการ X รายการ Y และรายการ Z หมายเลข 1 หมายถงมรายการของแถวนนปรากฏอยบนทรานแซคชนของหลกนน และหมายเลข 0 หมายถงไมมรายการของแถวนนปรากฏอยบนทรานแซคชนของหลกนน (Tan et al., 2002; Liu et al., 2008)
30
ตารางท 2-1 แสดงตวอยางทรานแซคชนทประกอบดวยรายการ X Y และ Z
T1 T2 T3 T4 T5 T6 T7 T8 X 1 1 1 1 0 0 0 0 Y 1 1 0 0 0 0 0 0 Z 0 1 1 1 1 1 1 1
พจารณาตารางขางตนจะเหนไดวารายการ X และรายการ Y นนมความสมพนธทแปรผนตรงกนหรอมสหสมพนธเชงบวกตอกน (Positively Correlated) เปนสวนใหญ กลาวคอถามรายการ X ปรากฏอยบนทรานแซคชนกจะมรายการ Y ปรากฏบนทรานแซคชนเปนสวนใหญและในทางกลบกนถาไมมรายการ X ปรากฏอยบนทรานแซคชนกจะไมมรายการ Y ปรากฏบนทรานแซคชนเปนสวนใหญเชนกน นอกจากนนยงสามารถสงเกตไดวารายการ X และรายการ Z นนมความสมพนธทแปรผกผนกนหรอมสหสมพนธเชงลบตอกน (Negatively Correlated) เปนสวนใหญ (รอยละ 62.5) ดวย กลาวคอถามรายการ X ปรากฏอยบนทรานแซคชนกจะไมมรายการ Z ปรากฏบนทรานแซคชนเปนสวนใหญและในทางกลบกนถาไมมรายการ X ปรากฏอยบนทรานแซคชนกจะมรายการ Z ปรากฏบนทรานแซคชนเปนสวนใหญเชนกน แตอยางไรกตามเมอไดค านวณหาคาสนบสนนและคาความเชอมนของกฎความสมพนธ X Y แลวไดคา 25% และ 50% ตามล าดบ และเมอค านวณหาคาสนบสนนและคาความเชอมนของกฎความสมพนธ X Z แลวไดคา 37.5% และ 75% ตามล าดบ จากคาสนบสนนและคาความเชอมนของกฎความสมพนธทงสองบงชวากฎความสมพนธ X Z มความนาสนใจมากกวากฎความสมพนธ X Y ตวอยางนไดแสดงใหเหนจดบกพรองของการใชตวแบบคาสนบสนน-คาความเชอมน ในการคนหากฎความสมพนธคอ กฎความสมพนธทมคาความเชอมนทมคาสงในตวอยางกลบเปนกฎความสมพนธทมความสมพนธแปรผกผนกนหรอมความสมพนธเชงลบตอกนสง
ตวอยางท 2 ก าหนดใหตารางดานลางนเปนตารางแสดงการปรากฏของรายการชาและรายการกาแฟในทรานแซคชนการซอสนคาในรานขายของช าแหงหนง แถว t และ t’ คอรอยละของทรานแซคชนทมรายการชาปรากฎอยและไมมรายการชาปรากฏอยตามล าดบ หลก c และ c’ คอรอยละของทรานแซคชน ทมรายการกาแฟปรากฏอยและไมมรายการกาแฟปรากฏอยตามล าดบ (Brin et al., 1997; Liu et al., 2008)
31
ตารางท 2-2 แสดงตวอยางรอยละของการปรากฏของรายการบนทรานแซคชนของรานขายของช าแหงหนง
c c’ รวม t 20 5 25 t’ 70 5 75 รวม 90 10 100
จากขอมลในตารางขางตน เมอน าไปใชตวแบบคาสนบสนน-คาความเชอมน เพอคนหากฎความสมพนธจะไดผลลพธคอไดกฎความสมพนธ t c มคาสนบสนนเทากบ 20% ซงในทางปฏบตถอวาเปนคาทคอนขางสงมาก คาความเชอมนของกฎความสมพนธ t c นจะเปนตวบงช ถงความนาจะเปนทลกคาจะซอกาแฟเมอลกคานนซอชา ซงมคาเทากบความนาจะเปนทจะซอชาและกาแฟหารดวยความนาจะเปนทจะซอชา นนคอ 20/25 = 0.8 หรอ 80% ซงจดไดวาเปนคาความเชอมนทสงมาก จากคาสนบสนนและคาความเชอมนทค านวณไวสามารถสรปไดวากฎความสมพนธ t c นเปนกฎความสมพนธทมอยจรงอยางสมเหตสมผล
แตในความจรงแลวขอมลทแสดงในตารางไมใชขอมลทงหมดในฐานขอมลของรานขายของช าแหงน ซงอาจเปนไปไดวาความสมพนธระหวางการซอชาและการซอกาแฟในทรานแซคชนใดๆเปนความสมพนธแปรผกผนกน จากตารางจะสามารถเหนไดเพยงคารอยละของการซอชาและซอกาแฟดวยคอรอยละ 20 คาทก าหนดใหในตารางไมเพยงพอจะน ามาค านวณคาสหสมพนธไดโดยตรงแตวาสามารถทราบทศของความสมพนธระหวางการซอชาและการซอกาแฟไดโดยการใชการค านวณคาลฟทดงสตร P(tUc)/(P(t)xP(c)) = 0.2/(0.25x0.9) = 0.89 คาลฟททค านวณมาไดนนมคานอยกวา 1 ซงบงชวาระหวางการซอชาและการซอกาแฟมความสมพนธเชงลบตอกนหรอการซอชาและการซอกาแฟแปรผกผนกนนนเอง จากตวอยางนแสดงเหนถงขอบกพรองของการใชตวแบบคาสนบสนน-คาความเชอมน ทท าใหไดกฎความสมพนธทขดแยงตอทศของสหสมพนธ
2.4.2 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม
การประเมนความนาสนใจของกฎความสมพนธดวยวธการตางๆ ทกลาวไปในขางตนนน แสดงใหเหนอยางชดเจนวาการใชตวแบบประเมนทแตกตางกนสงผลใหไดกฎความสมพนธทนาสนใจตางกนออกไป (Sheikh et al., 2004) เหตผลส าคญทท าใหเปนเชนนนกเพราะความไมสอดคลองกนของความนาจะเปนของการมกฎความสมพนธปรากฎกบคาสหสมพนธของกฎ
32
ความสมพนธ ในป 2008 Liu และคณะ (Liu et al., 2008) ไดน าเสนอตวแบบการประเมนความนาสนใจของกฎความสมพนธขนมาใหม โดยการพสจนทฤษฎบททเกยวของกบตวแบบคาสนบสนน-คาความเชอมน กบทฤษฎบทคาสหสมพนธ และตงชอการประเมนความนาสนใจของกฎความสมพนธแบบใหมนวา คาความเชอมนใหม (New Confidence) โดยใชสญลกษณ NConf(X Y) แทนคาความเชอมนใหมน ซงสามารถค านวณไดจากสตรดงตอไปน
ก าหนดให NConf(R) คอ คาความเชอมนใหมของกฎความสมพนธ R
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P( ) คอ คาความนาจะเปนในการไมพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
P(X|Y) คอ คาความนาจะเปนในการพบรายการ X ในทรานแซคชนทมรายการ Y อยแลว
NConf(X Y) =
–
หรอ NConf(X Y) = P(X|Y) – P(X| )
คาทเปนไปไดของคาความเชอมนใหมนนอยในพสย [-1, 1] ถาคาความเชอมนใหมมคาเทากบ 0 หมายความวาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกน ถาคาความเชอมนใหมนอยกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผกผนกนหรอสหสมพนธเชงลบ และถาคาความเชอมนใหมมากกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผนตามกนหรอสหสมพนธเชงบวก (Liu et al., 2008)
33
ในงานวจยของ Liu และคณะ (Liu et al., 2008) ทไดเสนอคาความเชอมนใหมขางตนนน Liu และคณะไดท าการเปรยบเทยบความสามารถของคาความเชอมนใหมกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ ทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) โดยใชฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชน ผลของการเปรยบเทยบคอ คาความเชอมนใหมสามารถบงบอกทศของความสมพนธไดอยางถกตองและสอดคลองกบคาเลฟเวอเรจและคาสหสมพนธ แตคาความเชอมนใหมนนสามารถระบความแตกตางของความนาสนใจของกฎความสมพนธ 2 กฎความสมพนธใดๆทคาเลฟเวอเรจและคาสหสมพนธไมสามารถระบได (กลาวคอกฎความสมพนธ 2 กฎทค านวณคาคาเลฟเวอเรจหรอคาสหสมพนธไดเทากนทง 2 กฎแตคาความเชอมนใหมใหคาทแตกตางกนระหวาง 2 กฎ) สวนคาประเมนความนาสนใจของกฎความสมพนธอนๆใหคาทขดแยงกบคาสหพนธ (กลาวคอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธนนมความสมพนธเชงลบตอกนแตกลบใหคาประเมนความนาสนใจของกฎความสมพนธทสงออกมา)
เนองจากการเปรยบเทยบคาความเชอมนใหมกบคาอนๆในงานวจยของ Liu และคณะ (Liu et al., 2008) เปนการทดสอบกบฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชนเทานน จงคอนขางขาดความนาเชอถอวาคาความเชอมนใหมจะใหประสทธภาพในการคนหากฎความสมพนธทดกวาคาอนๆจรง ผวจยจงรวบรวมวรรณกรรมทเกยวของกบคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมในหวขอ 2.5 ทงหมด 16 คณสมบต และท าการเปรยบเทยบคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธทง 8 คารวมถงคาความเชอมนใหมม
2.5 คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม
ในปค.ศ. 1991 Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) ไดเสนอคณสมบต 3 ประการส าคญทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะม ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y
34
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ใน
ฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ตองเทากบ 0 เมอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนทางสถต (M = 0 ถา P(X and Y) = P(X)P(Y))
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X and Y) เพมขนในขณะท P(X) และ P(Y) คงท
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X) (หรอ P(Y)) ลดลงในขณะท P(X and Y) และ P(Y) (หรอ P(X)) คงท
Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) เสนอคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทง 3 คณสมบตขนมาใหมความเปนทวไป (General) มากทสด โดยในทง 3 คณสมบตจะอางองถงพารามเตอรเพยง 3 ตวคอ P(X) P(Y) และ P(X and Y) ซงเปนคาทางสถตทเกยวของกบกฎความสมพนธเทานน (Freitas, 1999) ในงานวจยนผ วจยจะใชสญลกษณ P1 P2 และ P3 แทนการอางถงคณสมบตท 1 2 และ 3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991)
คณสมบต P1 นนเปนคณสมบตทอธบายวาถาเซตรายการทมากอนและเซตรายการทตามมานนเปนอสระตอกนแลวกฎความสมพนธนนกควรจะตองไมมความนาสนใจเลยหรอมคาประเมนความนาสนใจของกฎความสมพนธนนเทากบ 0 คณะวจยหลายคณะวจารณวาคณสมบตขอนนนไมคอยยดหยนและจ ากดมากเกนไป (Tan et al, 2002) ในป ค.ศ. 2002 Tan และคณะ (Tan et al, 2002) จงเสนอใหผอนคลายคณสมบตขอนใหมเปน คาประเมนความนาสนใจของกฎความสมพนธ M ตองเทากบ k เมอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนทางสถต (M = k ถา P(X and Y) = P(X)P(Y)) โดยท k คอคาคงท แตอยางไรกตามงานวจยตางๆ (Freitas , 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) ทน าคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะไปใชหรออางองถงกยงคงอางองตามตนฉบบคอคาประเมนความนาสนใจของกฎความสมพนธควรจะเทากบ 0 เมอกฎนนไมมความนาสนใจเลย คณสมบต P2 นน
35
เปนคณสมบตทอธบายวาในขณะทคาสนบสนนของเซตรายการทมากอนและคาสนบสนนของเซตรายการทตามมาคงท ถาคาสนบสนนของทงกฎความสมพนธเพมขน ความนาสนใจของกฎความสมพนธนนกควรจะเพมขนตามดวย กลาวคอถากฎความสมพนธมความสมพนธเชงบวกกนมากขน กฎความสมพนธนนกควรจะนาสนใจเพมขน และคณสมบต P3 นนเปนคณสมบตทอธบายวาในขณะทคาสนบสนนของกฎความสมพนธและคาสนบสนนของเซตรายการทมากอน (หรอ คาสนบสนนของเซตรายการทตามมา) คงท ถาคาสนบสนนของเซตรายการทตามมา (หรอ คาสนบสนนของเซตรายการทมากอน) ลดลงแลว ความนาสนใจของกฎความสมพนธนนควรจะเพมขน (Piatetsky-Shapiro, 1991; Geng and Hamilton, 2006)
ในปค.ศ. 1995 Major และ Mangano (Major and Mangano, 1995) เสนอใหน าคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) พรอมกบแนะน าใหเพมอก 1 คณสมบตเขาไปดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
Conf(XY) คอ คาความเชอมนของกฎความสมพนธ XY
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X) เพมขนในขณะท P(Y) P( ) และ Conf(XY) คงท
คณสมบตของนมกจะถกอางถงและน าไปใชพรอมๆกบคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) ดงนนคณสมบตนมกจะถกเรยกวาคณสมบตของท 4 ทคาประเมนความนาสนใจของกฎความสมพนธควรจะม ในงานวจยนผวจยจะใชสญลกษณ P4 แทนการอางถงคณสมบตขอนของ Major และ Mangano (Major and Mangano, 1995)
คณสมบต P4 นน เ ปนคณสมบต ทอ ธบายวาในขณะทคาความเ ชอมนของกฎความสมพนธมคาคงท เมอคาสนบสนนของของเซตรายการทมากอนเพมขนแลว คาประเมนความ
36
นาสนใจของกฎความสมพนธ M กควรจะเพมขนตามดวย ในขณะท P(Y) P( ) และ P(Y|X) (หรอ Conf(XY) นนเอง) คงท
ในปค.ศ. 2002 Tan และคณะ (Tan et al, 2002) เสนอคณสมบตอก 5 ประการทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะม เพมเตมจาก 4 ขอของคณะวจย Piatetsky-Shapiro (Piatetsky-Shapiro, 1991) และ Major กบ Mangano (Major and Mangano, 1995) โดยทคณสมบต 5 ประการของ Tan และคณะนนเปนคณสมบตทอยบนฐานของการด าเนนการบนตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ดงน
ตารางท 2-3 แสดงตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ของกฎความสมพนธ XY
Y X n(X and Y) n(X and ) n(X)
n( and Y) n( and ) n( ) n(Y) n( ) N
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
n(X) คอ จ านวนของทรานแซคชนทมรายการ X ในฐานขอมล n( ) คอ จ านวนของทรานแซคชนทไมมรายการ X ในฐานขอมล
n(X and Y) คอ จ านวนของทรานแซคชนทมรายการ X และ Y ในฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรมคณสมบตสมมาตรภายในการเปลยนแปลงล าดบ
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรคงทเมอมการขยายตามแถวหรอขยายตามหลก
37
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรสามารถบงชทศทางของความสมพนธได
4. คาประเมนความนาสนใจของกฎความสมพนธ M ควรคงทเมอมการด าเนนการทงตามแถวและตามหลกพรอมกน
5. คาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมมความสมพนธกบจ านวนของทรานแซคชนทมเซตรายการ X เซตรายการ Y หรอทงค
ในงานวจยนผวจยจะใชสญลกษณ O1 O2 O3 O4 และ O5 แทนการอางถงคณสมบตท 1 2 3 4 และ 5 ของ Tan และคณะ (Tan et al, 2002)
คณสมบต O1 นนเปนคณสมบตทอธบายวากฎความสมพนธ X Y และกฎความสมพนธ Y X ควรมคาประเมนความนาสนใจของกฎความสมพนธทเทากน Tan และคณะ (Tan et al, 2002) ผ เสนอคณสมบตขอนกลาววาคาประเมนความนาสนใจของกฎความสมพนธทไมแสดงคณสมบตสมมาตรสามารถแกไขใหมคณสมบตสมมาตรไดโดยการก าหนดใหคา M ของกฎความสมพนธ X Y และคา M ของกฎความสมพนธ Y X มคาเทากบคาใดคาหนงทมากกวาหรอเทากบ max(M(X Y), M(Y X)) นนเอง คณสมบตขอนถกปฏเสธวาไมเปนจรงในหลายงานวจย (Geng and Hamilton, 2006) คณสมบต O2 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y เมอตอนท n(X and Y) มคาเทากบ Z ควรจะเทากบคาการประเมนความนาสนใจของกฎความสมพนธ X Y เมอตอนท n(X and Y) มคาเทากบ k1k2Z โดยท k1, k2 เปนคาคงทบวกทมาขยายตามแถวและตามหลกตามล าดบ เปนตน คณสมบต O3 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองบงบอกไดวาเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกหรอความสมพนธเชงลบตอกนได คณสมบต O4 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y ควรเทากบคาการประเมนความนาสนใจของกฎความสมพนธ ดวย และคณสมบต O5 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมเปลยนแปลงเมอ n( and ) เปลยนแปลง กลาวคอคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมมความสมพนธกบจ านวนของทรานแซคชนทไมมทงเซตรายการทมากอนและเซตรายการทตาม (Tan et al, 2002)
38
ในปค.ศ. 2004 Lenca และคณะ (Lenca et al, 2004) กเสนอคณสมบต 5 ขอทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะมเชนกน หลงจากนนในป ค.ศ. 2007 Lenca และคณะไดปรบปรงคณสมบตทง 5 ขอนนเลกนอยเพอใหมความยดหยนมากขน (Lenca et al, 2007) ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
1. ถา P(X and ) = 0 แลว คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทหรอเปนอนนต (infinity)
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะลดลงแบบเสนตรง แบบพาราโบลาหงาย หรอแบบพาราโบลาคว า เมอ P(X and ) มคาเพมขน
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอ N เพมขนในขณะท P(X and Y) P(X) และ P(Y) คงท
4. คาประเมนความนาสนใจของกฎความสมพนธ M ทดควรจะตองสามารถหาคาเธรสโชลด (threshold) ทแบงแยกระหวางกฎความสมพนธทนาสนใจออกจากกฎความสมพนธทไมนาสนใจไดงาย
5. คาประเมนความนาสนใจของกฎความสมพนธ M ท ดควรจะตองมอรรถศาสตร (semantics) ทผใชสามารถเขาใจไดงาย
ในงานวจยนผวจยจะใชสญลกษณ Q1 Q2 Q3 Q4 และ Q5 แทนการอางถงคณสมบตท 1 2 3 4 และ 5 ของ Lenca และคณะ (Lenca et al, 2004; Lenca et al, 2007)
39
คณสมบต Q1 นนเปนคณสมบตทอธบายวาเมอกฎความสมพนธนนมความนาสนใจสงทสด หรอคาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมมรายการ Y ในฐานขอมลเทากบ 0 (หรอ คาความเชอมนเทากบ 1 นนเอง) แลวคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนตเพอสอความหมายอยางชดเจนวากฎความสมพนธนนนาสนใจสงทสด คณสมบต Q2 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองมการลงลดเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y ถกเพมเขามาในฐานขอมล ลกษณะของการลดลงจะเปนอยางไรนนขนอยกบวตถประสงคของงานทน าไปประยกตใช ตวอยางเชน ถาตองการใหคาประเมนความนาสนใจของกฎความสมพนธ M มความคงทน (Tolerated) ตอการเพมขนของทรานแซคชนทมรายการ X แตไมมรายการ Y (กลาวคอเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน คาประเมนความนาสนใจของกฎความสมพนธ M ควรลดลงทละเพยงเลกนอยเทานน) กควรก าหนดใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงแบบพาราโบลาหงาย (Concave up) เมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน แตถาตองการใหคาประเมนความนาสนใจของกฎความสมพนธ M มความออนไหวมาก (กลาวคอถามทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขนมาเพยงเลกนอยกจะท าใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงอยางรวดเรว) กควรก าหนดใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงแบบพาราโบลาคว า (Concave down, Convex) เมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน เปนตน คณสมบต Q3 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอจ านวนของทรานแซคชนทงหมดเพมขนในขณะทคาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และคาความนาจะเปนในการพบทรานแซคชนทมรายการ Y คงท คณสมบต Q4 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองสามารถหาคาเธรสโชลด (Threshold) ทเปนจดแบงแยกระหวางกฎความสมพนธทนาสนใจกบกฎความสมพนธทไมนาสนใจไดงาย และคาเธรสโชลดนนจะตองสอความหมายทผ ใชสามารถเขาใจไดงายดวย กลาวคอคาเธรสโชลดนนควรเปนคากลางระหวางคาสงสดกบคาต าสดนนเอง คณสมบต Q5 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทดควรจะตองสอความหมายทผ ใชสามารถเขาใจไดงาย กลาวคอเมอผ ใชอานคาประเมนความนาสนใจของกฎความสมพนธ M แลวจะตองสามารถเขาใจไดโดยงายวาคานหมายถงอะไร โดยไมตองอธบายใดๆเพมเตม (Lenca et al, 2004; Lenca et al, 2007)
40
ในปค.ศ. 2006 Geng และ Hamilton (Geng and Hamilton, 2006) กเสนอคณสมบต 2 ขอทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะมเชนกน แตคณสมบตทง 2 ขอของ Geng และ Hamilton (Geng and Hamilton, 2006) นจะเนนประเมนทความสมพนธระหวางคาประเมนความนาสนใจของกฎความสมพนธ คาสนบสนน และคาความเชอมน ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y Sup(XY) คอ คาสนบสนนของกฎความสมพนธ XY
Conf(XY) คอ คาความเชอมนของกฎความสมพนธ XY N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
n(X) คอ จ านวนของทรานแซคชนทมรายการ X ในฐานขอมล n( ) คอ จ านวนของทรานแซคชนทไมมรายการ X ในฐานขอมล
n(X and Y) คอ จ านวนของทรานแซคชนทมรายการ X และ Y ในฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรอยในรปของฟงกชนทขนกบคาสนบสนน (f(Sup(XY))) โดยทคาของฟงกชนนควรเพมขนเมอคาสนบสนนเพมขน ในขณะทขอบ (Margins) ของตารางหลายตวแปร (ตารางท 2-3) คงท
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรอยในรปของฟงกชนทขนกบคาความเชอมน (f(Conf(XY))) โดยทคาของฟงกชนนควรเพมขนเมอคาความเชอมนเพมขน ในขณะทขอบ (Margins) ของตารางหลายตวแปร (ตารางท 2-3) คงท
ในงานวจยนผวจยจะใชสญลกษณ S1 และ S2 แทนการอางถงคณสมบตท 1 และ 2 ของ Geng และ Hamilton (Geng and Hamilton, 2006)
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Sup(XY) = x และ Conf(XY) = y คณสมบต S1 นนเปนคณสมบตทอธบายวา เมอคา n(X) n( ) n(Y) และ n( )
คงทจะไดวา P(X and Y) = x, P( and Y) = (
) – x, P(X and ) = (
)) – x และ P( and ) =
1 –
) + x แลวคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของ
ฟงกชนทขนกบ x นนควรจะเพมขนเมอ x เพมขน และคณสมบต S2 กเชนเดยวกบคณสมบต S1
41
คอเปนคณสมบตทอธบายวา เมอคา n(X) n( ) n(Y) และ n( ) คงทจะไดวา P(X and Y) =
,
P( and Y) =
, P(X and ) =
และ P( and ) = 1 –
+
แลวคา
ประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบ y นนควรจะเพมขนเมอ y เพมขน (Geng and Hamilton, 2006)
คณสมบต S1 สอดคลองโดยตรงกบคณสมบต P2 (Heravi, 2009) และคณสมบต S2 สอดคลองโดยตรงกบคณสมบต Q2 (Geng and Hamilton, 2006)
คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมทงหมด 16 ขอขางตน คณสมบตทไดรบการยอมรบและถกอางองถงโดยงานวจยตางๆ (Freitas , 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) มากทสดคอคณสมบต P1 P2 และ P3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) และคณสมบต P4 ของ Mango และ Mangano (Major and Mangano, 1995)
จากหวขอท 2.3 ผ วจยไดทบทวนวรรณกรรมของคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) และหวขอ 2.4 ทผวจยทบทวนวรรณกรรมของคาประเมนความนาสนใจของกฎความสมพนธใหมทชอวา คาความเชอมนใหม (New Confidence) ทถกเสนอขนโดย Liu และคณะ (Liu et al., 2008) ผวจยจงรวบรวมงานวจยทท าการทดสอบคณสมบตทง 14 คณสมบตกบคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาและคาความเชอมนใหม การเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธ 8 คาทรวบรวมโดยคณะวจยของ Geng กบ Hamilton ในป 2006 และคณะวจยของ Heravi ในป 2009 (Geng and Hamilton, 2006; Heravi, 2009) และคาความเชอมนใหมทรวบรวมโดยผวจยแสดงดงตารางท 2-4 ในบทท 1
42
เนองจากงานวจยของ Liu และคณะในป 2008 (Liu et al., 2008) ไดท าการพสจนคณสมบตคาความเชอมนใหมไวทงหมดเพยง 5 คณสมบตคอ คณสมบต P1 P2 P3 O1 และ O2 เทานน ดงนนผ วจยจงพสจนคณสมบต P4 O3 O4 O5 Q1 Q2 Q3 S1 และ S2 ของคาความเชอมนใหมดงน
พสจนคณสมบต P4
คณสมบต P4 นน เ ปนคณสมบต ทอ ธบายวาในขณะทคาความเ ชอมนของกฎความสมพนธมคาคงท เมอคาสนบสนนของของเซตรายการทมากอนเพมขนแลว คาประเมนความนาสนใจของกฎความสมพนธ M กควรจะเพมขนตามดวย ในขณะท P(Y) P( ) และ P(Y|X) (หรอ Conf(XY) นนเอง) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
NConf(X Y) =
–
(เนองจาก = )
NConf(X Y) =
–
(เนองจาก = )
NConf(X Y) = P(X) (
–
)
จากขอก าหนด P(Y) P( ) และ P(Y|X) คงท
กรณทพจน (
–
) มคาเปนบวก จะท าให NConf(X Y) มคาเพมขนเมอ P(X)
เพมขน
กรณทพจน (
–
) มคาเปนลบ จะท าให NConf(X Y) มคาลดลงเมอ P(X)
ลดลง
ดงนน คาความเชอมนใหมไมมคณสมบต P4
43
พสจนคณสมบต O3
คณสมบต O3 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองบงบอกไดวาเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกหรอความสมพนธเชงลบตอกนได
เนองจาก คาทเปนไปไดของคาความเชอมนใหมนนอยในพสย [-1, 1] ถาคาความเชอมนใหมมคาเทากบ 0 หมายความวาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกน ถาคาความเชอมนใหมนอยกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผกผนกนหรอสหสมพนธเชงลบ และถาคาความเชอมนใหมมากกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผนตามกนหรอสหสมพนธเชงบวก (Liu et al., 2008)
ดงนนคาความเชอมนใหมมคณสมบต O3
พสจนคณสมบต O4
คณสมบต O4 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y ควรเทากบคาการประเมนความนาสนใจของกฎความสมพนธ
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
และ NConf( ) = P( | ) – P( |Y)
NConf( ) =
–
ตองการพสจนวา NConf(X Y) = NConf( )
–
=
–
คณ P(Y)P( ) ทง 2 ขาง
P( )P(X and Y) – P(Y)P(X and ) = P(Y)P( and ) – P( )P( and Y)
44
เนองจาก P(X and ) = P(X) – P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)P( and ) – P( )P( and Y)
เนองจาก P(X and ) = P(Y) - P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)P( and ) – P( )(P(Y) - P(X and Y))
เนองจาก P( and ) = 1 – P(X) – P(Y) + P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)(1 – P(X) – P(Y) + P(X and Y)) – P( )(P(Y) - P(X and Y))
P( )P(X and Y) – P(X)P(Y) + P(Y)P(X and Y) = P(Y) - P(X)P(Y) – P(Y)P(Y) + P(Y)P(X and Y) – P( )(P(Y) - P(X and Y))
เนองจาก P( ) = 1 – P(Y)
(1 – P(Y))P(X and Y) – P(X)P(Y) + P(Y)P(X and Y) = P(Y) - P(X)P(Y) – P(Y)P(Y) + P(Y)P(X and Y) – (1 – P(Y))(P(Y) - P(X and Y))
P(X and Y) – P(X)P(Y) = P(Y) - P(X)P(Y) - P(Y) + P(X and Y)
1 = 1 เปนจรง
ดงนนคาความเชอมนใหมมคณสมบต O4
พสจนคณสมบต O5
คณสมบต O5 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมเปลยนแปลงเมอ n( and ) เปลยนแปลง กลาวคอคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะค านวณมาจาก n(X) n(Y) หรอ/และ n(X and Y) เทานน (ไมม n( and ) หรอ N มาเกยวของ)
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
45
NConf(X Y) =
–
NConf(X Y) =
–
NConf(X Y) =
–
มพจนทเกยวของกบจ านวนทรานแซคชนทงหมด (N) คอพจน
ดงนนคาความเชอมนใหมไมมคณสมบต O5
พสจนคณสมบต Q1
คณสมบต Q1 นนเปนคณสมบตทอธบายวาเมอกฎความสมพนธนนมความนาสนใจสงทสด หรอคาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมมรายการ Y ในฐานขอมลเทากบ 0 (หรอ คาความเชอมนเทากบ 1 นนเอง) แลวคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนต
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
เมอกฎความสมพนธนนมความนาสนใจสงทสด นนคอ P(X and ) = 0
จะได NConf(X Y) =
NConf(X Y) =
NConf(X Y) =
เมอกฎความสมพนธนนมความนาสนใจสงทสด พจน n(X and Y) จะเปนจ านวนเตมบวกเทานน (ไมเปน 0) และพจน n(Y) คอจ านวนเตมบวก (ไมเปน 0)
จะได เมอกฎความสมพนธนนมความนาสนใจสงทสด คาความเชอมนใหมจะมคาเปน 1 ซงเปนคาคงทบวกเสมอ
ดงนนคาความเชอมนใหมมคณสมบต Q1
46
พสจนคณสมบต Q2
คณสมบต Q2 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองมการลงลดเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y ถกเพมเขามาในฐานขอมล โดยทลกษณะของการลดลงนนสามารถเปนได 3 แบบคอ ลดลงเปนเสนตรง ลดลงเปนพาราโบลาคว า หรอลดลงเปนพาราโบลาหงาย อยางใดอยางหนง
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
NConf(X Y) =
–
NConf(X Y) =
–
จะเหนวา เมอไมมทรานแซคชนทมรายการ X แตไมมรายการ Y นนคอ n(X and ) = 0
จะได NConf(X Y) =
เมอเรมมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน นนคอ n(X and ) > 0
จะได NConf(X Y) =
–
จากสมการเสนตรง y = mx+c
จะไดวาเมอเรมมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน สมการนเปนสมการเสนตรง
โดยท y คอ NConf(X Y)
x คอ n(X and )
m คอ –
c คอ
จะไดสมการเสนตรงทมความชนเปนลบ นนคอ NConf(X Y) ลดลง เมอม n(X and ) เพมขน
47
ดงนนคาความเชอมนใหมมคณสมบต Q2 และมลกษณะของการลดลงแบบเสนตรง (ใสหมายเลข 1 ในตารางท 2-4)
พสจนคณสมบต Q3
คณสมบต Q3 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอจ านวนของทรานแซคชนทงหมด (N) เพมขนในขณะทคาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และคาความนาจะเปนในการพบทรานแซคชนทมรายการ Y คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
เนองจาก P(X and ) = P(X) – P(X and Y)
และ P( ) = 1 – P(Y)
จะได NConf(X Y) =
–
จะเหนวาเมอ N เพมขนในขณะท P(X and Y) P(X) และ P(Y) คงท คา NConf(X Y) กคงท
ดงนนคาความเชอมนใหมมคณสมบต Q3
พสจนคณสมบต S1
คณสมบต S1 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบคาสนบสนนนนควรจะเพมขนเมอคาสนบสนนเพมขน เมอคา n(X) n( ) n(Y) และ n( ) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Sup(XY) = x
48
จะไดวา P(X and Y) = x, P( and Y) = (
) – x, P(X and ) = (
)) – x และ P( and ) = 1 –
) + x
ดงนน NConf(X Y) =
–
–
NConf(X Y) =
–
– +
–
พจน
– คงท เนองจาก n(X) และ n( ) คงท
และเมอ x เพม พจน
และพจน
– จะเพมขนดวย เนองจาก n(Y) และ n( ) คงท
ดงนนเมอ x เพม คา NConf(X Y) กจะเพมดวย
นนคอ Sup(XY) เพม คา NConf(X Y) กจะเพมดวย
ดงนนคาความเชอมนใหมมคณสมบต S1 (ใสหมายเลข 0 ในตารางท 2-4)
พสจนคณสมบต S2
คณสมบต S1 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบคาความเชอมนนนควรจะเพมขนเมอคาความเชอมนเพมขน เมอคา n(X) n( ) n(Y) และ n( ) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Conf(XY) = y
จะไดวา P(X and Y) =
, P( and Y) =
, P(X and ) =
และ P( and ) =
1 –
+
ดงนน NConf(X Y) =
–
49
NConf(X Y) =
–
NConf(X Y) =
–
+
พจน
คงท เนองจาก n(X) และ n( ) คงท
และเมอ y เพม พจน
และพจน
จะเพมขนดวย เนองจาก n(Y) และ n( ) คงท
ดงนนเมอ y เพม คา NConf(X Y) กจะเพมดวย
นนคอ Conf(XY) เพม คา NConf(X Y) กจะเพมดวย
ดงนนคาความเชอมนใหมมคณสมบต S2 (ใสหมายเลข 0 ในตารางท 2-4)
การทดสอบคณสมบตขางตนไมรวมคณสมบต Q4 และ Q5 เนองจากคณสมบตทง 2 นนเปนคณสมบตเชงอตวสย (Subjective Properties) หรอคณสมบตทขนอยกบผ ใชและโดเมนทน าไปใช ไมสามารถตดสนไดวามคณสมบตทง 2 ขอหรอไมถาไมไดอางองถงโดเมนและวตถประสงคทน าไปประยกตใช (Geng and Hamilton, 2006; Heravi, 2009) กบคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาและคาความเชอมนใหม การเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธ 8 คาทรวบรวมโดยคณะวจยของ Geng กบ Hamilton ในป 2006 และคณะวจยของ Heravi ในป 2009 (Geng and Hamilton, 2006; Heravi, 2009) และคาความเชอมนใหมทรวบรวมโดยผวจย แสดงดงตารางตอไปน
50
ตารางท 2-4 แสดงการเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด
P1 P2 P3 P4 O1 O2 O3 O4 O5 Q1 Q2 Q3 S1 S2 รวม คาสนบสนน 1 0 0 6
คาความเชอมน 1 1 0 0 7
คาคอนวคชน 2 0 0 0 7
คาลฟท 2 2 0 0 6
คาเลฟเวอเรจ 2 1 0 0 5
คาคฟเวอเรจ 3 1 0 3
คาสหสมพนธ 2 0 0 0 9
คาอตราสวนออดส 2 0 4 0 9
คาความเชอมนใหม 1 1 0 0 10
จากตารางขางตนเครองหมาย ในตารางหมายถงคาประเมนความนาสนใจของกฎความสมพนธทอยในแถวนนมคณสมบตของหลกนน เครองหมาย ในตารางหมายถงคาประเมนความนาสนใจของกฎความสมพนธทอยในแถวนนไมมคณสมบตของหลกนน ในหลกของคณสมบต P3 หมายเลข 0 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาความนาจะเปนของเซตรายการทมากอนลดลง หมายเลข 1 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาความนาจะเปนของเซตรายการทตามมาลดลง หมายเลข 2 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอทงคาความนาจะเปนของเซตรายการทมากอนและคาความนาจะเปนของเซตรายการทตามมาลดลงเทานน ในหลกของคณสมบต Q2 หมายเลข 0 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบพาราโบลาคว า หมายเลข 1 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบเสนตรง หมายเลข 2 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบพาราโบลาหงาย หมายเลข 3 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแตขนอยกบพารามเตอร หมายเลข 4 หมายถง คาประเมนความนาสนใจของกฎความสมพนธคงท หมายเลข 5 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขน หมายเลข 6 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมหรอลดไมแนนอนขนอยกบพารามเตอร ในหลก
51
ของคณสมบต S1 และ S2 หมายเลข 0 หมายถงคาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาสนบสนนเพมขน หมายเลข 1 หมายถงคาประเมนความนาสนใจของกฎความสมพนธคงทเมอคาสนบสนนเพมขน หมายเลข 2 หมายถงคาประเมนความนาสนใจของกฎความสมพนธลดลงเมอคาสนบสนนเพมขน หมายเลข 3 หมายถงไมสามารถประเมนได (not applicable) และหมายเลข 4 หมายถงคาประเมนความนาสนใจของกฎความสมพนธเพมหรอลดขนอยกบพารามเตอร (Geng and Hamilton, 2006; Heravi, 2009) หลกสดทายของตารางคอหลกทแสดงการรวมจ านวนคณสมบตทงหมดทคาประเมนความนาสนใจของกฎความสมพนธนนๆม
จากผลการพสจนคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธขางตนและตารางท 2-4 แสดงใหเหนวาคาความเชอมนใหมมคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม 10 คณสมบตจากทงหมด 14 คณสมบต ซงมากทสดเมอเทยบกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ โดยเฉพาะอยางยงการมคณสมบต O3 ของคาความเชอมนใหมจะท าใหการน าคาความเชอมนใหมไปใชนนจะสามารถขจดการเกดกฎความสมพนธทมเซตรายการทมากอนและเซตรายการทตามทมความสมพนธเชงลบออกไปได ผวจยจงเชอวาถาน าคาความเชอมนใหมนไปประยกตใชกบการคนหากฎความสมพนธกบขอมลประเภทตางๆรวมถงขอมลซอฟตแวรอารไควฟ แลวนาจะท าใหกฎความสมพนธทไดมาเปนกฎความสมพนธทนาสนใจและชวยลดการเกดกฎความสมพนธทเปนผลบวกลวง (False Positive) ได
2.6 การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control)
ซอฟตแวรทถกพฒนาขนในปจจบนนนมความซบซอนและขนาดทใหญกวาซอฟตแวรทถกพฒนาขนมาในอดตเปนอยางมาก ความยากและความซบซอนเหลานนถกสะทอนออกมาในการบรหารจดการการพฒนาและการบ ารงรกษาของซอฟตแวรนน แมวาหลายองคกรในปจจบนจะใชซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) คอยตดตามและจดการกบพฒนาการของความซบซอนของโครงการพฒนาซอฟตแวรกนอยางมาก แตทวาแนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) นนกลบเปนศาสตรทไดไมคอยถกพดถงและไมคอยมวฒนาการมาก
52
เทาไรในตลอดทศวรรษทผานมา (Löh et al., 2007) ในหวขอนไดเรยบเรยงวรรณกรรมทเกยวของกบการควบคมการเปลยนแปลงแกไข เรมตงแตแนวคดของการควบคมการเปลยนแปลงแกไข ซอฟตแวรทประยกตแนวคดของการควบคมการเปลยนแปลงแกไข และสดทายจะกลาวถงระบบคอนเคอเรนทเวอรชน (Concurrent Version System, CVS) ซงเปนซอฟตแวรโอเพนซอรสทประยกตแนวคดของการควบคมการเปลยนแปลงแกไขทไดรบความนยมสงมากนานกวาทศวรรษ (O’Sullivan et al., 2009)
2.6.1 แนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control)
การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control) เปนลกษณะอยางหนงของการควบคมเอกสาร (Documentation Control) แนวคดของการควบคมการเปลยนแปลงแกไข คอ การควบคมพฒนาการของเนอหาภายในเอกสารอเลกทรอนกสตลอดชวงอายของเอกสาร รวมถงการเรยกเนอหาในอดตกลบคน (Recovery) การบงชขอแตกตางระหวางเวอรชนของเนอหา และการใหรายละเอยดของพฒนาการแตละครงดวย (Tichy, 1982; Junqueira et al., 2008) การควบคมการเปลยนแปลงแกไขนนถกน าไปประยกตใชในทางวศวกรรมแขนงตางๆเพอการจดการการพฒนาทตอเนองไปของเอกสารอเลกทรอนกส เชน ซอรสโคดของโปรแกรมประยกต พมพเขยว แบบจ าลองอเลกทรอนกส และสารสนเทศส าคญอนๆ ซงพฒนาโดยทม การเปลยนแปลงเอกสารเหลานในแตละครงจะถกระบโดยใชการเพมหมายเลขการเปลยนแปลงแกไข (Revision Number) และมการเชอมโยงกบผกระท าการเปลยนแปลงแกไขดวย
การไหลของกจกรรมการควบคมการเปลยนแปลงแกไขเรมตนจากการสรางรพอสโทร (Creation of a Pepository) ส าหรบโครงการขนมา จากนนน าเขาแฟมขอมลทงหมดของโครงการ (Import Files of Project) ลงสรพอสโทรทสรางไว แฟมขอมลทน าเขามาครงแรกจะถกก าหนดคาเรมตน (Initial Set) ใหมหมายเลขการแกไขหรอหมายเลขเวอรชนเปน 1 เมอมความตองการเปลยนแปลงแกไขแฟมขอมลผ ใชกจะตองท าการลงทะเบยนออก (Check out) แฟมขอมลนนออกมาจากรพอสโทร การลงทะเบยนออกของแฟมขอมลกคอการส าเนาแฟมขอมลเวอรชนลาสดจากรพอสโทรมาเปนแฟมขอมลบนเครองของผ ใช (Local File) เมอผ ใชเปลยนแปลงแกไขแฟมขอมลเรยบรอยแลวจะตองการลงทะเบยนเขา (Check in) หรอคอมมท (Commit) แฟมขอมลนนกลบเขาสรพอสโทร การคอมมทแตละครงจะมผลใหหมายเลขการแกไขหรอหมายเลขเวอรชนมคาเพมขนไปเรอยๆ การไหลของกจกรรมจะวนลปเชนนไปเรอยๆตลอดชวงอายของโครงการ ใน
53
กรณทมผ ใชหลายคนท าการเปลยนแปลงแกไขแฟมขอมลเดยวกนในเวลาเดยวกน (มการลงทะเบยนออกของแฟมขอมลโดยผ ใชมากกวา 1 คนในชวงเวลาเดยวกน) จะท าใหเกดกจกรรมทส าคญขนอกกจกรรมคอการผสานเนอหา (Merge) การผสานเนอหาคอการปรบปรง (Update) เนอหาภายในแฟมขอมลบนเครองผใชทแกไขไปแลวกบเนอหาลาสดของแฟมขอมลนนในรพอสโทรซงอาจถกคอมมทเวอรชนใหมจากผ ใชอนในระหวางทผ ใชก าลงแกไขอย กลาวคอเปนการปรบปรงเนอหาของแฟมขอมลนนบนเครองของผใช (Local File) ใหสอดคลองกบเวอรชนบนรพอสโทรนนเอง ผใชสามารถท าการผสานเนอหาไดโดยการเรยกใชค าสงทชอวา update (Tichy, 1982; Ambriola et al., 1990; Junqueira et al., 2008) การไหลของกจกรรมการควบคมการเปลยนแปลงแกไขสามารถแสดงไดดงรปตอไปน (Junqueira et al., 2008)
Creation of a repository
Import files of a project
Checkout
Merge
Commit
รปท 2-1 แสดงการไหลของกจกรรมการควบคมการเปลยนแปลงแกไข
แนวคดของการควบคมการเปลยนแปลงแกไขทกลาวไปขางตนนนเปนแนวคดของการควบคมการเปลยนแปลงแกไขส าหรบเอกสารอเลกทรอนกสทวไป ส าหรบแนวคดของการควบคมการเปลยนแปลงแกไขในวศวกรรมซอฟตแวรจะหมายถงเทคนคและเครองมอทน ามาใชในการควบคมพฒนาการของแฟมขอมลซอรสโคดและแฟมขอมลอนๆภายในโครงการพฒนาซอฟตแวร (Junqueira et al., 2008) แฟมขอมลซอรสโคดนนเปนแฟมขอมลทมคณลกษณะเฉพาะตวมากกวาแฟมขอมลของเอกสารอเลกทรอนกส อนๆ ท าใหเทคนคทใชในการควบคมการเปลยนแปลงแกไขแฟมขอมลซอรส โคดมความละเอยดและเฉพาะตวมากกวาการควบคมการเปลยนแปลงแกไขของเอกสารอเลกทรอนกสอนๆ คณลกษณะเฉพาะนนกคอเนอหา (Contents) ภายในแฟมขอมลซอรสโคดนนเปนเนอหาทมโครงสรางและโครงสรางนนประกอบดวยหนวยยอยท
54
มความสมพนธกนอยภายใน ดวยเหตนการควบคมการเปลยนแปลงแกไขแฟมขอมลซอรสโคดจงตองมการด าเนนการขนสง (Advanced Operations) 2 อยางคอการตอกง (Branches) และการผสานกง (Merge) (Chadd et al., 2008)
ค าวา กง (Branch) ในทนหมายถง กลมของเวอรชนตางๆทถกสรางขนมาดวยเหตผลในการทดสอบอะไรบางอยางทยงไมมนใจเพยงพอทจะน าเวอรชนเหลานไปรวมกบเวอรชนหลกทเสถยรแลว การตอกงเปนการเปรยบเทยบการพฒนาซอรสโคดในลกษณะของตนไม (Tree) คอ การก าหนดใหซอรสโคดหลก (เวอรชนของซอรสโคดทมนใจวามความเสถยรสงแลว) เปนล าตน (Trunk) ของตนไม โดยปกตแลวเมอนกพฒนาแกไขหรอพฒนาซอรสโคดเพมเตมเขาไปจะท าใหเกดเวอรชนใหมขนมา เวอรชนใหมทเสถยรเหลานจะเรยงตอกนไปเปนล าดบ แตในกรณทนกพฒนามการแกไขหรอพฒนาซอรสโคดสวนใดสวนหนง ซงเปนการแกไขเพอทดสอบอะไรบางอยางและยงไมมนใจในความเสถยรของการแกไขครงนน เวอรชนใหมทถกสรางขนมานจะถกก าหนดใหเปนกง (Branches) ตอออกมาจากสวนล าตนหลกของตนไม ทศทางการพฒนาจะขยายออกจากสวนล าตนของตนไม การตอกงนเปนเทคนคทนยมใชมากในการควบคมการเปลยนแปลงแกไขของโครงการพฒนาซอฟตแวรทมขนาดใหญ เทคนควธการตอกงสามารถใชเพอการทดสอบซอรสโคดและเพมเตมซอรสโคดเมอเราตองการทจะขยายระบบหรอซอฟตแวรเพมเตม ในขณะทมการพฒนาสวนกงอยนนสวนล าตนกยงคงสามารถพฒนาตอออกไปไดเชนกน เมอพฒนาสวนทเปนกงเสรจแลวและมนใจความเสถยรของกงนนแลว นกพฒนาสามารถทจะน าสวนกงนนมารวมเขากบสวนล าตนหลกได เรยกวาการผสานกง (Merge)
ถาก าหนดใหการเปลยนแปลงแกไข (Change, Revision) คอการทนกพฒนาแกไข (alter) เพม (add) หรอ ลบ (delete) อยางใดอยางหนงบนแฟมขอมลซอรสโคด การคอมมท (Commit) กคอเซตของการเปลยนแปลงแกไขทกระท าโดยนกพฒนาคนเดยวกนในเวลาเดยวกนหรอใกลเคยงกนโดยทไมใชเซตวางนนเอง รปดานลางนแสดงตวอยางของการคอมมท ลงบนล าตนและบนกง โดยก าหนดให สญลกษณ C# คอการคอมมทครงท # และสญลกษณ f# คอการเปลยนแปลงแกไขบนแฟมขอมลท # (Junqueira et al., 2008)
55
รปท 2-2 แสดงตวอยางการคอมมทลงบนล าตนและบนกง
จากรปท 2-2 ขางตนนถามการผสานกงเกดขนหลงจากการคอมมทครงท 7 การด าเนนการของรพอสโทรทจะเกดขนกคอ พจารณาวาตงแตเกดการตอกงนขนมาจนถงการผสานกงมการเปลยนแปลงแกไขกบแฟมขอมลใดบาง ถาการเปลยนแปลงแกไขแฟมขอมลใดเกดขนทงบนกงและบนล าตน การเปลยนแปลงแกไขแฟมขอมลนนจะตองถกจบคกนแลวน าไปวเคราะหเชงลกวามการเปลยนแปลงแกไขทเกดความขดแยง (Conflict) ขนหรอไม ถาไมเกดความขดแยงขนเปลยนแปลงแกไขแฟมขอมลนนทงบนกงและบนล าตนกจะสามารถน ามาผสานกนไดทนท แตถาเกดความขดแยงขนจ าเปนจะตองใหผ ทท าการผสานกงเปนผตดสนวาจะแกไขความขดแยงน อยางไร ตวอยางเชน จากรปขางตน ตงแตจดเรมตนการตอกงจนถงจดการผสานกงนนมการคอมมทบนล าตนทงหมด 3 ครงคอ การคอมมทครงท 3 การคอมมทครงท 5 และการคอมมทครงท 7 และมการคอมมทบนกงทงหมด 2 ครงคอ การคอมมทครงท 4 และการคอมมทครงท 6 การเปลยนแปลงแกไขบนแฟมขอมลท 2 เกดขนทงการคอมมทบนกง (การคอมมทครงท 4) และการคอมมทบนล าตน (การคอมมทครงท 5) ดงนนการเปลยนแปลงแกไขบนแฟมขอมลท 2 ทงสองอนนจะตองถกน าไปวเคราะหเชงลกตอไป ถาพบวาเกดความขดแยงขนจะตองมการตดสนความขดแยงนน แตถาไมมการเปลยนแปลงแกไขบนแฟมขอมลท 2 ทงสองอนจะถกผสานเขาดวยกน (Junqueira et al., 2008)
เทคนคและขนตอนวธในการตอกง การผสานกง และการเปรยบเทยบความแตกตางระดบบรรทดของแตละซอฟตแวรควบคมการเปลยนแปลงแกไขนน มเทคนคและขนตอนวธทแตกตางกนออกไปตามซอฟตแวรควบคมการเปลยนแปลงแกไข ซงจะไมกลาวถงในทน
2.6.2 ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software)
ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) คอ ซอฟตแวรทน าแนวคดของการควบคมการเปลยนแปลงแกไขมาประยกตใชจรงในอตสาหกรรมการพฒนาซอฟตแวร ซอฟตแวรควบคมการเปลยนแปลงแกไขคอซอฟตแวรทใชใน
56
จดการการจดเกบ การคนคน การระบและการผสานการเปลยนแปลงแกไขแฟมขอมลซอรสโคดของโปรแกรมประยกต และสารสนเทศส าคญอนๆทพฒนาขนมาโดยทมอยางเปนอตโนมต ในซอฟตแวรควบคมการเปลยนแปลงแกไขนนจะมการบนทกแฟมขอมลซอรสโคดทงโครงการเอาไว นอกจากนนขอมลทเกยวของกบการเปลยนแปลงแกไขอนๆ อาทเชน ซอรสโคดสวนใดทถกแกไข นกพฒนาผบนทกเวอรชนใหมของซอรสโคด วนเวลาบนทกเวอรชนใหมของซอรสโคด และหมายเหตของการบนทกเวอรชนใหมของซอรสโคดนนจะถกบนทกอยในรปของแฟมขอมลบนทก (Log Files) แฟมขอมลบนทกเหลานถกแกไขใหมทกครงทมนกพฒนาท าการคอมมท แฟมขอมลซอรสโคดแตละเวอรชนในอดตและแฟมขอมลบนทกทงหมดจะถกเรยกรวมกนวา ซอฟตแวรอารไคฟว (Software Archives) (Zimmermann et al., 2004; Zimmermann et al., 2005)
ซอฟตแวรแรกทไดประยกตแนวคดของการควบคมการเปลยนแปลงแกไขขนมาจรง คอ ระบบควบคมซอรสโคด (SCCS: Source Code Control System) ซงถกแนะน าขนมาและออกจ าหนายครงแรกในป ค.ศ. 1972 โดยแบลแลบส (Bell Labs) (Rochkind et al., 1975) ในชวงแรกนนระบบควบคมซอรสโคดถกน าไปใชอยเพยงแคในวงจ ากดและไมคอยไดรบความนยมมากเทาไร (Baudis, 2009) หลงจากนนในป ค.ศ. 1985 เปนปแรกทระบบควบคมการเปลยนแปลงแกไข (RCS: Revision Control System) ไดถกเผยแพรออกมาและสามารถน าไปใชไดโดยไมเสยคาใชจาย (Tichy, 1985) หลงจากทถกเผยแพรไดไมนานระบบควบคมการเปลยนแปลงแกไขไดประสบความส าเรจอยางมากในอตสาหกรรมพฒนาซอฟตแวร (Baudis, 2009) ถงแมวาในปจจบนระบบควบคมการเปลยนแปลงแกไขจะไมไดมววฒนาการใดๆเพมขนมาและไมไดถกน าไปใชแลวแตระบบควบคมการเปลยนแปลงแกไขยงคงไดรบการกลาวถงอยเรอยๆในฐานะเปนตนแบบของแนวคดและรปแบบแฟมขอมล (File Format) ของซอฟตแวรควบคมการเปลยนแปลงแกไขทด (Baudis, 2009) ตอมาในป ค.ศ. 1990 ระบบคอนเคอเรนทเวอรชน (CVS: Concurrent Versions System) ทถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (RCS, Revision Control System) เปนตนแบบไดถกเผยแพรออกมาและไดรบความนยมอยางมากและรวดเรว นอกจากซอฟตแวรทง 3 ซอฟตแวรในขางตนแลวหลงจากนนในชวงทศวรรษท 1990 กมซอฟตแวรทประยกตแนวคดของการควบคมการเปลยนแปลงแกไขเกดขนมาอกอยางมากมาย ทงทเปนซอฟตแวรเชงพาณชย (Commercial Software) และซอฟตแวรเสร (Free/Open Source Software) ตวอยางซอฟตแวรควบคมการเปลยนแปลงแกไขเชงพาณชยเชน ClearCase (ป ค.ศ. 1992), Visual SourceSafe (ป ค.ศ. 1994), Perforce (ป ค.ศ. 1995) และ Code Co-op
57
(ป ค.ศ. 1997) ตวอยางซอฟตแวรควบคมการเปลยนแปลงแกไขทเปนซอฟตแวรเสรเชน CVSNT (ป ค.ศ. 1998) และ Subversion (ป ค.ศ. 2000)
เนองจากงานวจยนสนใจศกษาขอมลซอฟตแวรอารไคฟวทไดจากระบบคอนเคอเรนทเวอรชนดงนนผวจยจงเรยบเรยงรายละเอยดเกยวกบระบบคอนเคอเรนทเวอรชนรวมถงขอมลซอฟตแวรอารไคฟวของระบบคอนเคอเรนทเวอรชนไวในหวขอถดไป
2.6.3 ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS)
ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) คอซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) ซอฟตแวรหนงทไดรบความนยมสงสดในปจจบน (O’Sullivan et al., 2009) ระบบคอนเคอเรนทเวอรชนนนถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (Revision Control System, RCS) เปนตนแบบ และพฒนาขนมาอยางโอเพนซอรส ดงนนระบบคอนเคอเรนทเวอรชนนจงสามารถบรรจลง (download) มาใชไดโดยไมเสยคาใชจาย ความส าคญของระบบคอนเคอเรนทเวอรชนคอระบบคอนเคอเรนทเวอรชนนถกสรางขนมาใหเปนสวนประกอบ (component) ทส าคญสวนประกอบหนงทชวยใหบรรลถงมาตรฐานของการจดการคาองคประกอบของซอฟตแวร (SCM, Software Configuration Management) ซงเปน 1 ใน 6 กลมกระบวนการหลก (Process Area) ในระดบท 2 ของมาตรฐาน CMM (Capability Maturity Model) ได (Grune et al., 2006)
ววฒนาการของระบบคอนเคอเรนทเวอรชนนนเรมตนขนในเดอนกรกฎาคมป ค.ศ. 1986 Grune และคณะไดเรมตนการเผยแพรบางสวนระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ในรปแบบของเชลลสครพท (Shell Script) ลงสกลมขาว (News-Group) ทชอวา comp.sources.unix ตอมาในเดอนเมษายนป ค.ศ. 1989 Berliner และ Polk (Berliner et al., 1989) ไดออกแบบและพฒนาระบบคอนเคอเรนทเวอรชนเพมเตมซงเวอรชนของ Berliner นกคอเวอรชนทใชกนอยในปจจบน (Cederqvist, 2006; Grune et al., 2006) จนกระทงวนท 19 พฤศจกายน ป ค.ศ. 1990 ระบบคอนเคอเรนทเวอรชนทสมบรณพรอมใชงานเวอรชนท 1 ไดถกเสนอเขาสมลนธซอฟตแวรเสร (Free Software Foundation) เพอการพฒนาและการเผยแพรตอไป (Grune et al., 2006)
ระบบคอนเคอเรนท เวอรชน เ ปนซอฟตแวรควบคมการเปลยนแปลงแกไข ทใ ชสถาปตยกรรมลกขาย-แมขาย (Client-Server) การท างานหลกของระบบคอนเคอเรนทเวอรชน
58
คอ การเกบประวตการท างานของแฟมขอมลตางๆในโครงการพฒนาซอฟตแวร เพอชวยแกปญหาในการคนหาความแตกตางของซอรสโคดพนฐานเดมกบซอรสโคดทท าการแกไขใหม นกพฒนาสามารถทจะท าการเปลยนแปลงซอรสโคด แกไขขอผดพลาดและรวม (Merge) ซอรสโคดทตนพฒนาอยกบซอรสโคดลาสดของนกพฒนาคนอนๆได ระบบคอนเคอเรนทเวอรชนนนมรปแบบการท างานแบบ 1 รพอสโทร (Repository) แตหลายๆ พนทท างาน (Workspace) ภายใตรปแบบการท างานนนกพฒนาแตละคนสามารถน าซอรสโคดมาพฒนาเพยงงานเดยวหรอหลายๆงานกได เมอแกไขเรยบรอยแลวกท าการรวม (Merge) งานทท าเขาดวยกน และสามารถชวยใหนกพฒนาคนหาไดวาขอผดพลาดเกดขนนน เกดขนทไหนและกระท าโดยใคร โดยปกตแลวการบนทกเวอรชนทกๆเวอรชนของแตละเอกสารเอาไวนนเปนการกระท าทคอนขางสนเปลองเนอทบนทก (Disk) เปนอยางมาก แตระบบคอนเคอเรนทเวอรชนนนมวธการบนทกแตละเวอรชนของเอกสารภายในแฟมขอมลแฟมเดยวดวยวธทมประสทธภาพ นนคอระบบคอนเคอเรนทเวอรชนจะบนทกเฉพาะสวนทแตกตางกนของแตละเวอรชนเอาไวเทานน (Cederqvist, 2006)
เนองจากระบบคอนเคอเรนทเวอรชน (CVS) เปนระบบทถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (Revision Control System, RCS) เปนตนแบบ รปแบบแฟมขอมล (File Format) ของระบบคอนเคอเรนทเวอรชนจงใชรปแบบเดยวกบระบบควบคมการเปลยนแปลงแกไขทงหมดรวมถงรปแบบของแฟมขอมลบนทก (CVS Log File) ดวย การดงแฟมขอมลบนทกของโครงการทเกบอยบนรพอสโทรสามารถท าไดโดยการใชค าสง cvs log และแฟมขอมลบนทกจะถกท าส าเนาและสงกลบมายงเครองทใชค าสงน (Fischer et al., 2003) ตวอยางบางสวนของแฟมขอมลบนทกของคอนเคอเรนทเวอรชนแสดงดงรปดานลางน (Fischer et al., 2003)
59
รปท 2-3 แสดงตวอยางแฟมขอมลบนทกของคอนเคอเรนทเวอรชน
แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชนประกอบดวยหลายสวน (Sections) โดยทแตละสวนจะอธบายถงเวอรชนในอดตของแตละแฟมขอมลทอยในโครงการ (1 สวนตอ 1 แฟมขอมล) สวนแตละสวนจะถกแบงออกจากกนดวยบรรทดของเครองหมายเทากบ (=) ภายในแตละสวนจะประกอบดวยแอททรบวต (Attributes) และคาของแอททรบวตนนๆ แอททรบวตทส าคญและถกน าไปใชในการวเคราะหตางๆ มรายละเอยดดงน (Fischer et al., 2003)
- แอททรบวต RCS file คอ พาธ (Path) ทระบต าแหนงของแฟมขอมลทสมพนธกบสวนนทบนทกอยบนรพอสโทรของระบบคอนเคอเรนทเวอรชน โดยอางองจากต าแหนงราก (Root)
ข อ ง ร พ อ ส โ ท ร จ า ก ร ป ท 2-3 ร ะ บ ว า ส ว น น เ ป น ส ว น ข อ ง แ ฟ ม ข อ ม ล ช อ nsCSSFrameConstructor.cpp ซงมพาธอยท /cvsroot/mozilla/layout/html/style/src/ nsCSSFrameConstructor.cpp
- แอททรบวต symbolic names คอ รายการของคชอแทก (Tag Name) กบหมายเลขการ
เปลยนแปลงแกไข ทนกพฒนาตงชอไวเพอสะดวกในการอางองถง จากรปท 2-3 ระบวาแฟมขอมลชอ nsCSSFrameConstructor.cpp ถกตงชอแทกไวหลายชอ ตวอยางเชนแทกชอ MOZILLA_1_3a_RELEASE คกบหมายเลขการเปลยนแปลงแกไขท 1.800
60
- แอททรบวต description คอ รายการของการเปลยนแปลงแกไขทเกดขนกบแฟมขอมลน เรมตงแตทแฟมขอมลนไดถกลงคอมมทเขาสรพอสโทรจนถงเวอรชนลาสดของแฟมขอมลน นอกจากการเปลยนแปลงแกไขทถกบนทกลงบนล าตนหลก (Main Trunk) แลวทกๆการเปลยนแปลงแกไขทถกบนทกลงบนกง (Branches) กถกบนทกไวในสวนนดวยเชนกน การเปลยนแปลงแกไขแตละการเปลยนแปลงแกไขจะถกแบงออกจากกนดวยบรรทดเครองหมายยตภงค (-) ภายในแตละสวนยอยนอธบายการเปลยนแปลงแกไขทงหมดทเคยเกดขนกบแฟมขอมล ประกอบดวย 1) หมายเลขการเปลยนแปลงแกไข (Revision Number) 2) วนและเวลา (Date) ทคอมมทการเปลยนแปลงแกไขนเขามา 3) นกพฒนา (Author) ทเปนผคอมมท 4) สเตท (Atate) ระบถงสถานภาพในขณะนนของแฟมขอมล มคาทเปนไปได 2 คา คอ Exp หมายถง สถานภาพทดสอบ (Experimental State) และ Dead หมายถง แฟมขอมลถกลบไปแลว 4) บรรทด (Lines) ระบจ านวนบรรทดทถกเพมเขาไป (น าหนาดวยเครองหมายบวก) และจ านวนบรรทดทถกลบออกไป (น าหนาดวยเครองหมายลบ) ของแฟมขอมลส าหรบการคอมมทครงน 5) รายการหมายเลขกง (Branches) คอรายการของหมายเลขการเปลยนแปลงแกไขบนกงทมการเปลยนแปลงแกไขนเปนจดตอกง และ 6) บรรทดสดทายของสวนการเปลยนแปลงแกไขระบขอความหมายเหต (Comment) ทผพฒนาเขยนระบไวในการคอมมท ตวอยางรายการการ
เปลยนแปลงแกไขหนงจากรปท 2-3 คอรายการการเปลยนแปลงแกไขทมหมายเลขการเปลยนแปลงแกไขท 1.804 บนทกวนท 13 ธนวาคม ค.ศ. 2002 เวลา 20 นาฬการ 13 นาท 16 วนาท บนทกโดย [email protected] อยในสถานภาพทดสอบ การเปลยนแปลงแกไขครงนมบรรทดทถกเพมเขาไปจ านวน 15 บรรทด บรรทดทถกลบออกไป 47 บรรทด และ ม ข อความหมายเหตจ ากผ บนทกว า Don't set NS_BLOCK_SPACE_MGR and NS_BLOCK_WARP_SIZE on ...
2.7 การประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive)
ในชวงตนของการคดคนและพฒนาแนวคดการท าเหมองขอมลดวยดวยเทคนคการคนหากฎความสมพนธ (Association Rule Mining) นน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธถกพฒนามาเพอการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคา ตวอยางเชนการคนหาวาลกคาทซอหนงสอ ก. มกจะซอหนงสออะไรดวย จากฐานขอมล
61
รายการซอหนงสอขนาดใหญ นอกจากความสามารถในการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคาแลว ตอจากนนมาไมนานนกเรมมนกวจยหลายคณะน าการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธมาประยกตใชกบขอมลในแขนงตางๆ เชน ขอมลเครอขายโทรคมนาคม ขอมลการจดการความเสยง ขอมลการควบคมคลงสนคา และขอมลทางพนธกรรมของสงมชวต เปนตน (Kotsiantis et al., 2006) นอกจากนนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธยงสามารถประยกตใชกบขอมลซอฟตแวรอารไคฟว (Software Archive) ของขนตอนการพฒนาซอฟตแวรในวงจรชวตการพฒนาซอฟตแวรไดอกดวย คณะนกวจยตางๆน าขอมลซอฟตแวรอารไคฟวมาวเคราะหในหลากหลายรปแบบตางๆกน เชน การวเคราะหเพอท าความเขาใจพฒนาการของการพฒนาซอฟตแวร (Software Evolution) (Ball et al., 1997) การวเคราะหเพอดกจบพฒนาการของการเชอมโยงกน (Evolution Coupling) ระหวางคลาส (Bieman et al., 2003) หรอระหวางไฟล (Gall et al.,1998; Burch et al., 2005) ตางๆในระหวางการพฒนาโปรแกรม การวเคราะหเพอดกจบพฒนาการของการเกดขนตอกนระหวางไฟลพรอมระบล าดบการเปลยนแปลง (Burch et al., 2005) การวเคราะหเพอดกจบพฒนาการของการเกดขนตอกนอยางละเอยดระหวางสวนยอยภายในโปรแกรม (Program Entities) อยางเชน ระหวางฟงกชนหรอระหวางตวแปร (ซงจดวาละเอยดกวาการพจารณาเพยงแคระดบระหวางคลาสหรอระหวางไฟล) (Zimmermann et al., 2004) การวเคราะหเพอคนหารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองเพอการน ารปแบบเหลานนกลบมาใชใหม (Michail, 2000) และรปแบบการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาดได (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) งานวจยในอดตเหลานแสดงใหเหนถงประโยชนของการท าเหมองขอมลดวยกฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ซงมสวนชวยในการท างานรวมกนของนกพฒนาซอฟตแวรระหวางขนตอนการพฒนาซอฟตแวรในวงจรชวตการพฒนาซอฟตแวรเปนอยางมาก ประโยชนของการท าเหมองขอมลดงกลาวไดแก 1) แนะน าและคาดการณลวงหนาวานกพฒนาซอฟตแวรควรจะแกไขคลาส ไฟล หรอฟงกชนใดตอไปหลงจากทไดแกไขคลาส ไฟล หรอฟงกชนหนงไปแลว 2) ปองกนการเกดขอผดพลาดจากการแกไขคลาส ไฟล หรอฟงกชนใดอยางไมสมบรณ 3) สามารถดกจบการเกดของการขนตอกนระหวางคลาส ไฟล หรอฟงกชนได โดยเฉพาะอยางยงการขนตอกนทไมสามารถดกจบไดในระหวางขนตอนการวเคราะหและออกแบบซอฟตแวร (Zimmermann et al., 2004)
ในงานวจยนสนใจเฉพาะการประยกตใชการท าเหมองขอมลดวยกฎความสมพนธจากขอมลซอฟตแวรอารไคฟวในขนตอนการพฒนาซอฟตแวร โดยจะเนนเฉพาะความสมพนธในระดบ
62
ทละเอยดทสด นนกคอในระดบความสมพนธระหวางฟงกชนหรอเมธอด รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาส (Function-Call-Usage Pattern) คอเซตหรอบญชรายการของการเรยกใชฟงกชนหรอเมธอดในคลาสทพบอยในซอรสโคดของซอฟตแวร รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสเหลานมกจะเกดขนมาจากสญชาตญาณและองคความรสามญของนกพฒนาซอฟตแวร รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสบางรปแบบกเกดขนมาโดยทนกพฒนาซอฟตแวรไมรตว ซงทงหมดนมกจะไมไดถกน ามาจดท าเปนเอกสารอยางเปนทางการและอยนอกเหนอความสามารถของการตรวจหาจดบกพรองของระบบตรวจจดบกพรองภายในซอฟตแวรดวย
ในชวงป 2005 คณะวจยของ Li และคณะวจยของ Livshits (Li et al., 2005; Livshits et al., 2005) ไดท าการประยกตเทคนคการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธในการคนหารปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสของระบบซอฟตแวรขนาดใหญเพอทจะแกไขปญหาดงทกลาวไว งานวจยของคณะวจยทง 2 ไดแสดงใหเหนวาการประยกตเทคนคการท าเหมองขอมลดวยกฎความสมพนธในการคนหารปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสนนเปนเทคนคทคอนขางมประสทธภาพมากแตในบางกรณนนสามารถท าใหเกดผลลพธของการคนหาทเปนผลบวกลวง (False Positive) เปนจ านวนมาก กลาวคอการใชเทคนคดงกลาวอาจกอใหเกดกฎความสมพนธทเปนไปไดออกมาโดยความจรงแลวไมไดมกฎความสมพนธนนอยจรงๆ
นอกจากการนนการใชเทคนคการคนหากฎความสมพนธกยงคงมขอดอยทส าคญในการคนหารปแบบทเรยกใชฟงกชนหรอเมธอดในคลาสกคอ ธรรมชาตการเรยกใชฟงกชนหรอเมธอดในคลาสนนล าดบของการเรยกใชฟงกชนหรอเมธอดในคลาสยอมมความส าคญ เชน เมธอด open() ยอมถกเรยกใชงานกอนเมธอด close() แตการใชเทคนคการคนหากฎความสมพนธไมสามารถบงชถงล าดบได (Huzefa Kagdi et al., 2007)
ตอมาไมนานงานวจยของ Burch และคณะ (Burch et al., 2005) ไดท าการประยกตการท าเหมองขอมลดวยเทคนคการคนหารปแบบล าดบ (Sequential pattern Mining) กบขอมลซอฟตแวรอารไคฟว เพอแกไขขอบกพรองการใชเทคนคคนหากฎความสมพนธ ทไมไดใหความส าคญกบล าดบของการเรยกฟงกชนหรอเมธอดในคลาส ผลลพธทไดจากการใชเทคนคการคนหารปแบบล าดบนนมความแมนย าสงมากและใหผลลพธทเปนผลบวกลวงนอยกวาเทคนคอนๆ แตอยางไรกดการท าเหมองขอมลดวยเทคนคการคนหารปแบบล าดบนนมาพรอมกบคาใชจายในการประมวลผลทสงมาก ดวยเหตน การท าเหมองขอมลเพอคนหารปแบบทมความสมพนธกนใน
63
ขอมลซอฟตแวรอารไคฟวในทางปฏบตนนเหมาะกบการใชเทคนคการคนหากฎความสมพนธมากกวาการใชเทคนคการคนหารปแบบล าดบถงแมวาการใชเทคนคการคนหารปแบบล าดบจะใหผลลพธทแมนย ากวากตาม (Burch et al., 2005)
2.8 ขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives)
วตถประสงคของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) นนกคอ การสรางเซตของค าแนะน าในการเปลยนแปลงแกไขใหกบนกพฒนาในระหวางขนตอนการพฒนาซอฟตแวรเมอนกพฒนาไดท าใหเกดเหตการณใดเหตการณหนงเกดขน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวมขนตอนหลกทงหมด 2 ขนตอน คอ 1) การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) และ 2) การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) รายละเอยดของแตละขนตอนอธบายไดดงตอไปน
2.8.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives)
ในป ค.ศ. 1997 คณะวจยของ Ball เปนคณะวจยแรกทไดเรมท างานวจยเกยวกบขอมลซอฟตแวรอารไคฟวและไดพบวาขอมลซอฟตแวรอารไคฟวซงประกอบดวยแฟมขอมลซอรสโคดและแฟมขอมลบนทกของซอฟตแวรควบคมการเปลยนแปลงแกไขนนสามารถแสดงไดถงพฒนาการของการพฒนาซอฟตแวรหรอระบบนนๆ และยงสามารถแสดงถงการเชอมโยงกนหรอความสมพนธกนระหวาง 2 คลาส (Class) ภายในซอฟตแวรหรอระบบไดดวย นอกจากนนยงแสดงใหเหนถงความสมพนธของสงตางๆ (aspects) ในขนตอนการพฒนาซอฟตแวรทมผลตอการเปลยนแปลงขอมลซอฟตแวรอารไคฟว (Ball et al., 1997)
งานวจยของ Ball และคณะในป ค.ศ. 1997 นถอเปนจดเรมตนแรกใหเกดงานวจยเกยวกบขอมลซอฟตแวรอารไคฟวขนมาอกมากมายในเวลาตอมา ซงสามารถยกตวอยางไดดงตอไปน
64
1) การประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอชวยเหลอการท างานของนกพฒนาซอฟตแวรอาทเชน คาดการณและแนะน านกพฒนาซอฟตแวรวาควรจะตองแกไขซอรสโคดสวนไหนตอไป แสดงการเชอมโยงกนของคลาสทเกดขนในระหวางการพฒนาซงไมสามารถดกจบพบไดในชวงของการออกแบบซอฟตแวร และปองกนไมใหเกดขอผดพลาดทเกดขนจากการแกไขซอรสโคดไมสมบรณ (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Yu et al., 2007)
2) การประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอคนหารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองเพอการน ารปแบบเหลานนกลบมาใชใหม (Michail, 2000) และคนหารปแบบการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาดได (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005)
3) การจนตทศนผลของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอแสดงใหนกพฒนาซอฟตแวรเหนถงพฒนาการของการเชอมโยงกน (Evoluation Coupling) ของคลาสทเกดขนในระหวางการพฒนาซอฟตแวร (Burch et al., 2005; Voinea et al., 2005; Voinea et al., 2006; Weissgerber et al., 2007)
การท าเหมองขอมลกบขอมลประเภทตางๆนนจะตองมขนตอนสามญขนตอนหนงทตองท ากอนเปนอนดบแรกเสมอนนกคอขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมล (Preparing Data for Mining) หรอทเรยกวา ขนตอนกอนกระบวนการท าเหมองขอมล (Preprocessing) งานวจยทกงานวจยเกยวกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทกลาวไปในขางตนนนกตองผานการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ดวยเชนกน ขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลนถอเปนขนตอนทมความส าคญมากส าหรบการท าเหมองขอมลในทกๆประเภท เพราะขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลนนจะสงผลกระทบโดยตรงกบคณภาพของการวเคราะหผลลพธทจะไดมาจากการท าเหมองขอมล
ในหวขอนจะกลาวถงขนตอนส าคญ 4 ขนตอนทจะเกดขนในการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ทถกเสนอขนมาโดย Zimmermann และคณะ ในป
65
2004 (Zimmermann et al., 2004) และเปนขนตอนวธทมงานวจยทเกยวของกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวหลายงายวจย (Zimmermann et al., 2005; Livshits et al., 2005; Williams et al., 2005; Breu et al., 2006; Weißgerber et al, 2006) น าไปใช ขนตอนทง 4 ขนตอนไดแก 1) การสกดขอมล (Data Extraction) 2) การซอมแซมทรานแซคชน (Restoring Transactions) 3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities) และ 4) การก าจดสงแปลกปลอม (Data Cleaning) แตกอนทจะเรมการอธบายรายละเอยดของการท างานในแตละขนตอนขางตน ผวจยจ าเปนตองนยามค าศพทและสญลกษณทเกยวของกบการอธบายขนตอนการท างานดงตอไปน
เอนทต (Entity) คอ เอกลกษณหรอสงทผ วจยสนใจศกษา ในทนค าวา เอนทต สามารถหมายถง แฟมขอมลเอกสาร คลาส เมธอดหรอฟงกชน และตวแปร นยามใหเอนทต e ถกเขยนอยในรปแบบ (c, i, p) โดยท c คอหมวดหรอประเภทของเอนทตนน (syntactic category) i คอชอของเอนทตนน (identifier) และ p คอเอนทตทเปนเอนทตแมของเอนทตนนหรอใชสญลกษณ … แทนในกรณทเอนทตนนคอเอนทตรากหรอในกรณทตองการละไวในฐานทเขาใจ ตวอยางของเอนทตเชน (method, initDefaults(), (Class, Comp, (file, Comp.java,…))) แสดงถงเมธอดชอ initDefaults() ของคลาส Comp ในแฟมขอมล Comp.java
การเปลยนแปลงแกไข (Changes, Revisions) คอ เหตการณทมนกพฒนาแกไขเอนทตใดๆ ค าวา เปลยนแปลงแกไข ในทนสามารถแสดงได 3 มต คอ 1) การเปลยนแปลงเอนทต (alter) ใชสญลกษณ alter(e) แทนการเปลยนแปลงอะไรบางอยางภายในเอนทต e 2) การเพมลงในเอนทต (add to) ใชสญลกษณ add_to(e) แทนการเพมเอนทตใหมเขาไปในเอนทต e 3) การลบออกจากเอนทต (delete from) ใชสญลกษณ del_from(e) แทนการลบเอนทตใดๆออกจากเอนทต e
ทรานแซคชน (Transaction) คอ เซตของการเปลยนแปลงแกไขทเกดขนพรอมกนและถกคอมมทเขาสระบบ โดยหนงทรานแซคชนใดๆจะเปนของนกพฒนาเพยงคนเดยวเทานน ตวอยางของทรานแซคชนเชน T = {alter(method, initDefaults(), …), alter(field, fKeys[], …), add_to(file, Comp.java, …)} การ
66
เปลยนแปลงแกไขทอยภายในทรานแซคชนบางครงอาจถกเรยกวา รายการ (item)
เหตการณ (Situation) คอเซตของการเปลยนแปลงแกไขใดๆ ใชสญลกษณ Q แทนเหตการณ ตวอยางของเหตการณเชน Q = {alter(method, initDefaults(), …)}
กฎความสมพนธ (Association Rules) ทไดจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอกฎความสมพนธทตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไขอะไรดวย ตวอยางของกฎความสมพนธสามารถเขยนไดดงน {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} แทนกฎความสมพนธทวา เมอมการเปลยนแปลงตวแปรชอ fKey[] แลวจะมการเปลยนแปลงเมธอดชอ initDefaults() และการเปลยนแปลงแฟมขอมลชอ plug.properties ดวย
เซตของค าแนะน าส าหรบเหตการณ Q (The Set of Suggestions for Situation Q) คอ เซตของการเปลยนแปลงแกไขทนกพฒนาควรจะท าตามหลงจากทนกพฒนาไดเปลยนแปลงแกไขตามเหตการณ Q โดยอางองมาจากเซตของกฎความสมพนธ R เซตของค าแนะน าส าหรบเหตการณ Q สามารถเขยนเปนสญลกษณไดคอ ⋃ ตวอยางเซตของค าแนะน าส าหรบเหตการณ Q เชน = {alter(method, initDefaults(), …), add_to(file, Comp.java, …)}
เมอไดท าความเขาใจกบนยามและสญลกษณของค าศพทแลว สวนตอไปนคอการอธบายรายละเอยดของการท างานในแตละขนตอนของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
2.8.1.1 การสกดขอมล (Data Extraction)
จดประสงคหนงของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอ เพอใหสามารถเขาถงขอมลภายในระบบคอนเคอเรนทเวอรชนไดอยางรวดเรวในขณะท
67
ก าลงท าเหมองขอมล วธการทดทสดทจะบรรลจดประสงคนนไดกคอการส าเนาแฟมขอมลบนทกจากรพอสโทรของระบบคอนเคอเรนทเวอรชน ท าการสกดขอมลจากแฟมขอมลบนทกนน และน ามาบนทกไวบนฐานขอมลของผวจยเอง (Zimmermann et al., 2004)
โดยทวไปแลว ขอมลทจะถกสกดออกมาจะออกมาเปนอยางไรนนจะขนอยกบวามความตองการวเคราะหขอมลอะไร ตวอยางเชน ถามความตองการทจะวเคราะห พฒนาการของซอฟตแวร (Software Evolution) กจะใหความสนใจกบขอมลทกอยางทบนทกเอาไวรวมถงแฟมขอมลทถกลบไปแลวดวย (Zimmermann et al., 2004) แตถามความตองการทจะวเคราะหเพอใหค าแนะน ากบนกพฒนาในการแกไขแฟมขอมลทเกยวของกน กจะใหความสนใจกบขอมลทบนทกเอาไวในปจจบนเทานน (Zimmermann et al., 2004)
การสกดขอมลของระบบคอนเคอเรนทเวอรชนเรมตนจากการเรยกใชค าสง CVS log จากไดเรคทอรราก (Root Directory) ของโครงการพฒนาซอฟตแวรทตองการ ผลลพธทสงกลบคนมากคอแฟมขอมลซอรสโคด (Source Code Files) และแฟมขอมลบนทก (Log File) ของระบบคอนเคอเรนทเวอรชนทบนทกอยบนรพอสโทร แฟมขอมลบนทกทไดมาจะถกน ามาวเคราะหรปแบบไวยากรณ (Parse) และถกน าไปบนทกลงฐานขอมลตามแผนภาพขางลางน (Zimmermann et al., 2004)
รปท 2-4 แสดงการท างานของขนตอนการสกดขอมล (Data Extraction)
68
ขอมลทไดจากการสกดขอมลจากแฟมขอมลบนทกกคอ 1) แฟมขอมล (Files) ทงหมดทอยในโครงการน ทง ทเปนแฟมขอมลซอรสโคดและแฟมขอมลอนๆ ดวย 2) ไดเรคทอร (Directories) ทงหมดทอยในโครงการน 3) การเปลยนแปลงแกไขแฟมขอมล (Revisions) 4) ทรานแซคชนของการเปลยนแปลงแกไข (Transactions) 5) การตงชอแทก (Tags) และ 6) การตอกง (Branches) รายละเ อยดของขนตอนการสกดขอมลสามารถอธบายไดดงตอไปน (Zimmermann et al., 2004)
- แอททรบวต RCS file ของแตละสวน (Sections) ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอและรายละเอยดของแฟมขอมล (Files) และไดเรคทอร (Directories) ทงหมดของโครงการ ตวอยางจากรปขางตนจะได แฟมขอมลชอ IBuffer.java และไดเรคทอร ./org.eclipse.jdt.core/Model/org/eclipse/jdt/core/
- แอททรบวต description ประกอบดวยสวนยอยหลายสวนแตละสวนแสดงถงการเปลยนแปลงแกไขแตละครงทเกดขน ขอมลในแตละสวนยอยนสามารถสกดขอมลออกมาเปนรายการการเปลยนแปลงแกไขแฟมขอมล (Revisions) ได ตวอยางจากรปขางตนจะได รายการการเปลยนแปลงแกไขแฟมขอมลทงหมด 4 รายการ คอ รายการการเปลยนแปลงแกไขหมายเลข 1.15.2.1 1.15 1.16 และ 1.17
- รายการการเปลยนแปลงแกไขแฟมขอมลทไดมาขางตนจะถกน ามาพจารณาวารายการใดบางทเกดขนในเวลาเดยวกนและเกดขนโดยนกพฒนาคนเดยวกนจะถกรวมกนไวเปนทรานแซคชนของการเปลยนแปลงแกไข (Transactions) เดยวกน ตวอยางจากรปขางตนจะไดวามทรานแซคชนทง 4 ทรานแซคชนและแตละทรานแซคชนประกอบดวยรายการการเปลยนแปลงแกไขเพยง 1 รายการ
- แอททรบวต symbolic name ในแตละสวนยอยของแอททรบวต description ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอของแทก (Tags) ทนกพฒนาตงไวใหกบการเปลยนแปลงแกไขนนๆได ตวอยางจากรปขางตนจะไดวาส าหรบแฟมขอมล IBuffer.java มการตงชอแทกทงหมดหลายชอและมชอหนงคอ V_397 ทตงไวใหกบรายการการเปลยนแปลงแกไขหมายเลข 1.16
- การตอกง (Branches) สามารถสกดมาจากรายการการเปลยนแปลงแกไขและชอแทก ตวอยางจากรปขางตน เชน ชอแทก JDK_1_5 ตงใหรายการการเปลยนแปลงแกไขหมายเลข 1.15.0.2 จะไดชอของการตอกงนเปน 1.15.2 สวนจดตอกงนนไดมาจากตารางแฮช (Hash Map) ทใชชอของการตอกงเปนคย
69
2.8.1.2 การซอมแซมทรานแซคชน (Restoring Transactions)
ระบบคอนเคอเรนทเวอรชนโดยทวไปนนจะไมมการบนทกเอาไววาแฟมขอมลใดบางทถกเปลยนแปลงแกไขรวมกนในการคอมมทแตละครง แตวาขอมลการเปลยนแปลงแกไขดงกลาวมความจ าเปนตอการน ามาวเคราะหขอมลซอฟตแวรอารไคฟว (Zimmermann et al., 2004; Gall et al., 2003) วธการใหไดมาซงขอมลการเปลยนแปลงแกไขทเกดรวมกนในแตละการคอมมทกคอ การเขาไปอานขอมลทถกบนทกเอาไวในแฟมขอมลบนทก (Log File) บนเครองแมขายของระบบคอนเคอเรนทเวอรชนวามขอความบนทก (Log Message) ใดบางทระบการเปลยนแปลงแกไขทงหมดทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกน ขอมลการเปลยนแปลงแกไขทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกนจะถกน ามาเปลยนเปนทรานแซคชน 1 ทรานแซคชนแลวบนทกลงในตาราง Transactions บนฐานขอมล ค าวา ในเวลาเดยวกน ในทนนนหมายรวมถงในเวลาทใกลเคยงกนดวย เนองจากการคอมมทในแตละครงอาจใชเวลาในการด าเนนการหลายวนาทหรอหลายนาท โดยเฉพาะอยางยงการคอมมททละหลายๆแฟมขอมล (Zimmermann et al., 2004) ดงนนในแตทางปฏบตแลวนอกจากการพจารณาทการคอมมทในเวลาเดยวกนแลวยงตองมวธการพจารณาทการคอมมทระหวางชวงของเวลา (Time Interval) เดยวกนดวย วธการพจารณาการเปลยนแปลงแกไขระหวางชวงของเวลานนม 2 วธคอ
1) วธก าหนดกรอบเวลาทแนนอน (Fixed Time Windows) คอ การก าหนดกรอบของชวงเวลามากสดทจะพจารณาวาการเปลยนแปลงแกไขดงกลาวนนอยภายในทรานแซคชนเดยวกนหรอไม โดยก าหนดใหกรอบของชวงเวลาจะเรมตนขนใหมเมอมการเปลยนแปลงแกไขใหมเกดขนครงแรกและกรอบจะคงทเชนนจนจบการพจารณา การเปลยนแปลงแกไขใดทอยในกรอบนทงหมดจะถกพจารณาวาอยในทรานแซคชนเดยวกน วธนเปนวธทงายและสะดวกในการน าไปประยกตใช วธการพจารณาทการเปลยนแปลงแกไขระหวางชวงของเวลาเดยวโดยก าหนดกรอบเวลาทแนนอนถกน าไปใชในงานวจยของ Ubranic´ และคณะ (Ubranic´ et al., 2003) และในงานวจยของ Gall และคณะในป ค.ศ. 2003 (Gall et al., 2003)
2) วธเลอนกรอบเวลา (Sliding Time Windows) คอ การก าหนดชองวางระหวางการเปลยนแปลงแกไข 2 ครงทมากทสด จดเรมตนของกรอบของชวงเวลาจะถกเลอนไปทการเปลยนแปลงแกไขครงตอไปเสมอตราบใดทการเปลยนแปลงแกไขครงตอไปนนม
70
จดเรมตนอยภายในกรอบเวลาของการเปลยนแปลงแกไขครงกอนหนา ดงนนการพจารณาดวยวธเลอนกรอบเวลานจะสามารถรจ า (Recognize) การคอมมททใชระยะเวลาในการด าเนนการนานกวาจะสมบรณไดดกวาการพจารณาดวยวธก าหนดกรอบเวลาทแนนอน วธเลอนกรอบเวลานมตนก าเนดมาจากโปรแกรมประยกตทมชอวา cvs2cl (http://www.red-bean.com/cvs2cl) และ CVSps (http://www.cobite.com/cvsps) (Zimmermann et al., 2004)
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา (Zimmermann et al., 2004) สวน (a) แสดงการพจารณาดวยวธก าหนดกรอบเวลาทแนนอน บรเวณสขาวเปนบรเวณทอยภายในกรอบเวลาทก าหนดเอาไวแนนอน ดงนนการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 แฟมขอมล B เวอรชนท 1.2 และแฟมขอมล C เวอรชนท 1.4 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน รปท 2-5 สวน (b) แสดงการพจารณาดวยวธเลอนกรอบเวลา โดยเรมตนกรอบเวลาทมชวงแนนอนเรมตนทจดการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 และกรอบเวลาถกเลอนไปเรอยๆ จนสนสดดงรป ดงนนการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 แฟมขอมล B เวอรชนท 1.2 แฟมขอมล C เวอรชนท 1.4 แฟมขอมล D เวอรชนท 1.3 และ แฟมขอมล E เวอรชนท 1.5 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน
โดยปกต การใชวธเลอนกรอบเวลาส าหรบทกการเปลยนแปลงแกไข α1, α2, …, αk (เรยงตามล าดบเวลาทบนทก (time(αi)) ) ทเปนสวนหนงของทรานแซคชน T เดยวกนนน จะตองอยภายใตเงอนไข
71
{ }
นอกจากนนการเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลจะปรากฏอยบน 1 ทรานแซคชนไดเพยงครงเดยว เนองจากระบบคอนเคอเรนทเวอรชนไมอนญาตใหมการคอมมทการเปลยนแปลงเวอรชนของแฟมขอมลเดยวกน 2 ครงในเวลาเดยวกนได ดงนนจงมเงอนไขเพมอก 1 ขอดงน
ขนตอนวธในการรวมกลม (grouping) การเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลใหมาเปนทรานแซคชนนน เปนขนตอนวธทเรยบงายและตรงไปตรงมา ดงน (Zimmermann et al., 2004)
1) เรยงล าดบการเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลตาม เวลา ชอของนกพฒนาทท าการเปลยนแปลง และขอความในแฟมขอมลบนทก (log messager)
2) เรมตนทรานแซคชนท i โดยวนซ าพจารณาแตละ การเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมล ถากรอบเวลาของทรานแซคชนปจจบนจบลง หรอ ชอนกพฒนา เวลา และ/หรอ ขอความในแฟมขอมลบนทกของการเปลยนแปลงแกไขเวอรชนของแฟมขอมลท i แตกตางจากชอนกพฒนา เวลา และ/หรอ ขอความในแฟมขอมลบนทกของการเปลยนแปลงแกไขเวอรชนของแฟมขอมลท i-1 แลว ถอเปนการสนสดทรานแซคชนท i
3) วนซ าขอ 2 ไปจนกวาจะหมดขอมลเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมล
งานวจยของ Zimmermann และคณะในป ค.ศ. 2004 (Zimmermann et al., 2004) งานวจยของ Livshits และคณะในป ค.ศ. 2005 (Livshits et al., 2005) งานวจยของ Weißgerber และคณะในป ค.ศ. 2005 (Weißgerber et al., 2005) และป ค.ศ. 2007 (Weißgerber et al., 2007) เลอกพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา และก าหนดชวงของกรอบเวลาอยท 200 วนาท
72
2.8.1.3 การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
ขอมลทถกจดเกบไวในรพอสโทรของระบบคอนเคอเรนทเวอรชนนนมเพยงขอมลแฟมขอมลทกแฟมขอมลในโครงการและขอมลการเปลยนแปลงแกไขในระดบแฟมขอมล (File) หรอคลาส (Class) ทเกบอยในรปของแฟมขอมลบนทก (Log File) เทานน แตไมมบนทกวาการเปลยนแปลงแกไขทเกดขนนนเกดขนกบฟงกชน (Function) หรอ เมธอด (Method) ใดบาง มตวแปร (Variable) ใดถกเพมเขามา แกไข หรอถกลบออกไปบาง (Zimmermann et al., 2004)
การเปรยบเทยบความแตกตางอยางละเอยดถงในระดบตวแปร และ ฟงกชน หรอ เมธอดนมวธการหลายวธ วธการอยางงายๆกคอการเปรยบเทยบในระดบแฟมขอมล โดยการประยกตใชฟงกชนดฟฟ (diff) (Miller et al., 1985) กบแตละบรรทดของซอรสโคดระหวางแฟมขอมลของเวอรชนเกากบแฟมขอมลเวอรชนใหม ผลลพธทไดคอสวนของโคดทมการเปลยนแปลง สวนทมการเพมเขาใหมและสวนทถกลบออกไป วธการนมขอเสยทส าคญอย 2 ประการคอ 1) คณภาพของผลลพธทไดจะขนอยกบคณภาพของฟงกชนดฟฟ (diff) ทน ามาใช 2) วธการนระบความแตกตางไดแคในระดบบรรทดของซอรสโคด ไมสามารถระบ ไ ดวาเ ปนตรงไหนของบรรทดนน (Zimmermann et al., 2004)
วธการทมความแมนย าสงกวาแตกมคาใชจายในการค านวณสงวธหนง คอการก าหนดเอนทต (ตวแปร ฟงกชนหรอเมธอด คลาส แฟมขอมล) ทงหมดภายในแฟมขอมลทง 2 เวอรชนโดยการน าไปผานตววเคราะหไวยากรณ (Parser) จากนนกท าการเปรยบเทยบซอรสโคดของเอนทต เดยวกนใน 2 เวอรชน หรอกลาวคอเปนการประยกตใชฟงกชนดฟฟ (diff) ในระดบของเอนทต นนเอง วธการนสามารถด าเนนการไดดงตอไปน (Zimmermann et al., 2004)
1) ก าหนดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน r1 ของแฟมขอมล และก าหนดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน r2 ของแฟมขอมลเดยวกน
2) เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 3) เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 4) ทกๆเอนทตทอยในเซต E1 E2 อาจจะเปนเอนทตทมการเปลยนแปลงภายใน การตดสน
วาเอนทตใดบางทมการเปลยนแปลงแกไขสามารถท าไดโดยการประยกตใชฟงกชนดฟฟ (diff) กบซอรสโคดของเอนทตนนๆของทง 2 เวอรชน
73
ภายในแพลตฟอรม (Platform) ของอคลพซ (Eclipse) นนมการจดเตรยมโครงราง (Framework) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆทมประสทธภาพสงและสามารถน าไปประยกตเพมเตมได วธการทง 2 วธการทไดกลาวไปขางตนนนสามารถน ามาประยกตใชจรงไดโดยเรยกใช 2 โครงรางดงตอไปน (Zimmermann et al., 2004)
1) โครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) คลาสเรนจดฟเฟอรเรนเซอร (RangeDifferencer Class) ท าการเปรยบเทยบความแตกตางของแฟมขอมล 2 เวอรชนโดยใชโทเคน (Token) เปนฐาน วธการนอางองวธการในการเปรยบเทยบมาจากขนตอนวธดฟฟ (diff Algorithm) ดงเดมของ Miller และ Myers (Miller et al., 1985) โทเคนแตละโทเคนจะถกสรางขนมาโดยคลาสทมการอมพลเมนต (Implementing) อนเตอรเฟส (Interface) ชอวา ไอโทเคนคอมพาราเตอร (ITokenComparator interface) ตวอยางคลาสทมการอมพลเมนตโทเคนคอมพาราเตอร คอ คลาสดอคไลนคอมพาราเตอร (DocLineComparator Class) ทสามารถค านวณความแตกตางของแตละบรรทดในคลาสไดและใหผลลพธออกมาเปนรายการ (List object) ของบรรทดทแตกตางกนระหวาง 2 เวอรชนของแฟมขอมลทน ามาเปรยบเทยบกน
2) โครงรางสตรคเชอรเมรจววเวอร (Structure Merge Viewer) คลาสดฟเฟอรเรนเซอร (Differrencer Class) ท าการเปรยบเทยบความแตกตางของแฟมขอมล 2 เวอรชนโดยใชโครงสรางล าดบขน (hierarchical Structure) เปนฐาน ผลลพธทไดจากการเปรยบเทยบคอตนไมทอธบายการความแตกตางระหวาง 2 เวอรชนของแฟมขอมลอยางละเอยด โครงสรางล าดบขนแตละโครงสรางทเปนตวแทนของแฟมขอมลนนๆจะถกสรางขนมาโดยคลาสทมการอมพลเมนตอนเตอรเฟสชอวาไอสตรคเชอรครเอเตอร (IStructureCreator Interface) แตถาไมตองการสรางคลาสทมการอมพลเมนตอนเตอรเฟสไอสตรคเชอรครเอเตอร มาใชเองกสามารถใชคลาสจาวาสตรคเชอรครเอเตอร (JavaStructureCreator Class) ทแพลตฟอรมอคลพซจดเตรยมไวใหแลวส าหรบการสรางโครงสรางล าดบขนของคลาสแฟมขอมลภาษาจาวา (Java)
74
2.8.1.4 การก าจดสงแปลกปลอม (Data Cleaning)
ในหวขอกอนหนานอธบายถงการสกดขอมล การซอมแซมทรานแซคชน และการแปลงการเปลยนแปลงแกไขไปสระดบเอนทต ซงผลลพธทไดมานนยงมสงแปลกปลอม (Noise) ปะปนมาดวย ขนตอนการก าจดสงแปลกปลอม (Data Cleaning) เปนขนตอนทเขาไปตรวจสอบขอมลทงหมดเพอคนหาสงแปลกปลอมและก าจดสงแปลกปลอมเหลานนออกไป ลกษณะของขอมลทรานแซคชนทจะถกระบวาเปนสงแปลกปลอมมอย 2 ลกษณะคอ 1) ทรานแซคชนขนาดใหญ (Large Transactions) และ 2) ทรานแซคชนการผสานกง (Merge Transactions) รายละเอยดของสงแปลกปลอมและวธการในการก าจดสงแปลกปลอมทง 2 ลกษณะนสามารถอธบายไดดงตอไปน (Zimmermann et al., 2004)
ทรานแซคชนขนาดใหญ (Large Transactions)
ทรานแซคชนขนาดใหญเปนเหตการณปกตทสามารถเกดขนไดจรงกบขอมลจรงในทกประเภท ขอมลทไดจากระบบคอนเคอเรนทเวอรชนนนอาจมขอมลทไมเกยวกบของกบการน าไปวเคราะหมาปะปนอยดวย ขอมลทไมเ กยวของกบการว เคราะหอาท ขอความทระบการเปลยนแปลงแกไขแฟมขอมลทเปนการแกไขโครงสรางภายในของแตละแฟมขอมลเองทเกดขนตอเนองกนแตไมไดมความสมพนธเชงตรรกะระหวางแฟมขอมลเหลานน เชน ขอความ “Chage #include filenames from <foo.h> [sign] to <openssl.h>.” ทปรากฎตอเนองกน 552 ครงส าหรบการแกไขแฟมขอมล 552 แฟมขอมล ขอความลกษณะดงกลาวจะถกระบวาเปนสงแปลกปลอมทอาจสงผลใหผลลพธของการวเคราะหผดพลาดได วธก าจดสงแปลกปลอมลกษณะน ท าไดโดยการกรอง (filter out) ทรานแซคชนทมขนาดใหญเกนกวาคา N ทก าหนดไวออก
ทรานแซคชนการผสานกง (Merge Transactions)
ในระหวางทนกพฒนาก าลงพฒนาซอฟตแวรดวยระบบคอนเคอเรนทเวอรชนอยนนอาจมการสรางกง (Branches) ของเวอรชนขนมาหลากหลายกง กงเหลานนบางกงอาจจะถกผสานกง (Merge) เขากบล าตนเวอรชนหลกในอนาคต แตบางกงของเวอรชนกถกปลอยทงเอาไว
75
รปท 2-6 แสดงตวอยางการตอกงและผสานกง
รปท 2-6 แสดงตวอยางการตอกงและการผสานกงอยางงายในระบบคอนเคอเรนทเวอรชน กงทตอออกมานนประกอบดวยการคอมมททงหมด 4 ทรานแซคชน ไดแก ทรานแซคชน {A, B} ทรานแซคชน {C, D} ทรานแซคชน {E, F} และทรานแซคชน {G, H} แฟมขอมล A B C D E F G และ H เหลานจะถกเปลยนแปลงแกไขอกครงตอนทมการผสานกงเขากบล าตนเกดเปนทรานแซคชน {A, B, C, D, E, F, G, H} ทจดผสาน (Merge Point) และเรยกทรานแซคชน {A, B, C, D, E, F, G, H} วา ทรานแซคชนการผสานกง
ทรานแซคชนการผสานกงถกระบวาเปนสงแปลกปลอมดวยสาเหตส าคญ 2 สาเหตคอ 1) ทรานแซคชนการผสานกงเปนทรานแซคชนทประกอบดวยการเปลยนแปลงแกไขแฟมขอมลทไมมความสมพนธเกยวของกนอยางแทจรง ตวอยางเชน ทรานแซคชนการผสานกงขางตนมการเปลยนแปลงแกไขแฟมขอมล B และการเปลยนแปลงแกไขแฟมขอมล C อยภายใน ซงในความเปนจรงทง 2 แฟมขอมลไมมความสมพนธเกยวของกน 2) ทรานแซคชนการผสานกงถกสรางมาจากการน าการเปลยนแปลงแกไขทมทงหมดบนกงนนมาเรยงตอกน ดงนนทรานแซคชนการผสานกงจงเปนทรานแซคชนทมความซ าซอนกบทรานแซคชนอนทมอยบนกงนนอยแลว
จากเหตผลทง 2 ขอขางตน การน าทรานแซคชนการผสานกงไปใชในการท าเหมองขอมลดวย อาจท าใหผลลพธทไดจากการท าเหมองขอมลผดพลาดได ดงนนทรานแซคชนการผสานกงทจะเกดขนทกครงทมการผสานกงเกดขนจะตองถกคนหาใหพบและก าจดออก
2.8.2 การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives)
หลงจากทขอมลการเปลยนแปลงแกไขภายในรพอสโทรของระบบคอนเคอเรนทเวอรชนไดถกน ามาด าเนนการตามขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวร
76
อารไคฟวทกลาวไปขางตนและไดผลลพธของการด าเนนการออกมาเปนขอมลรายการทรานแซคชนแลว ขอมลรายการทรานแซคชนเหลานนจะถกน ามาเปนขอมลเขาส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ผลลพธหรอขอมลออกทไดจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวกคอ กฎความสมพนธทสามารถตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไขอะไรดวย ตวอยางเชน
{alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)}
กฎความสมพนธในขางตนนนหมายความวา เมอไรกตามทนกพฒนามการเปลยนแปลงอะไรบางอยางกบตวแปรชอ fkey[] แลวนกพฒนาควรจะตองไปเปลยนแปลงแกไขอะไรบางอยางใน เมธอดชอ initDefaults() และเปลยนแปลงแกไขอะไรบางอยางในแฟมขอมลชอ plug.properties
โดยทวไปแลว กฎความสมพนธ r จะอยในรปของค (x1, x2) โดยทเซตรายการ x1 และ x2 ไมมสวนซอนทบกน (disjoint) หรออยในรปของ x1 x2 ซง x1 จะถกเรยกวาเซตรายการทมากอน (Antecedent Itemset) และ x2 จะถกเรยกวาเซตรายการทตามมา (Consequent Itemset) กฎความสมพนธแตละกฎนนถกสราง (derived) ขนมาจากการพจารณาความนาจะเปนจากทรานแซคชนทเกดขนจรงในอดต วธทนยมน ามาใชในการประเมนความนาสนใจของแตละกฎความสมพนธคอการพจารณาคาสนบสนน (Support) และคาความเชอมน (Confidence) ของกฎความสมพนธ แตส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวนนจะใชวธการประเมนความนาสนใจของแตละกฎความสมพนธโดยการพจารณาทคาสนบสนนนบ (Support Count) และคาความเชอมน (Confidence) ของกฎความสมพนธ (Zimmermann et al., 2005) นยามของคาสนบสนนนบ และคาความเชอมน ของกฎความสมพนธส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวนน สามารถอธบายไดดงน
คาสนบสนนนบ (Support Count) คอ จ านวนของทรานแซคชนทกฎความสมพนธนนปรากฏอย ตวอยางเชน สมมตใหตวแปร fKey[] เคยปรากฏวาถกเปลยนแปลงแกไขไปทงหมด 11 ทรานแซคชน ภายใน 11 ทรานแซคชนนนม 10 ทรานแซคชนทมการเปลยนแปลงแกไขเมธอด initDefaults() และแฟมขอมล plug.properties ดวย ดงนนคาสนบสนนนบของกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} เทากบ 10 การท าเหมองขอมลกบ
77
ขอมลซอฟตแวรอารไคฟวนนใชคาสนบสนนนบ แทนทการใชคาสนบสนนอยางในการท าเหมองขอมลทวๆไปเพราะสาเหตส าคญ 2 ประการคอ 1) คาสนบสนนนบ สามารถสอสารใหนกพฒนาเขาใจไดดกวาคาสนบสนน กลาวคอ คาสนบสนนนบ เทากบ 10 หมายถงทผานมาในอดตเคยมเหตการณตามกฎความสมพนธเกดขนมาแลวทงหมด 10 ครง แตคาสนบสนน เทากบ 0.000145 นนไมสามารถสอสารอะไรไดเลยถาไมไดบอกขอมลเพมเตมวาจ านวนทรานแซคชนทมอยทงหมดนนเทากบเทาไร 2) คาสนบสนนนบ สามารถถกน าไปใชในการวเคราะหอนๆได ตวอยางเชน นอกจากการใชกฎความสมพนธในการใหค าแนะน านกพฒนาในระหวางการพฒนาแลว กฎความสมพนธสามารถบอกไดถงพฒนาการของการเชอมโยงกนระหวางแฟมขอมล (Evoluation Coupling) ได ในการระบพฒนาการของการเชอมโยงกนระหวางแฟมขอมลนนใชแคเพยงคาสนบสนนนบกสามารถระบได เพราะจ านวนทรานแซคชนทงหมดมผลตอการระบพฒนาการของการเชอมโยงกนระหวางแฟมขอมลนอยมาก (Zimmermann et al., 2005)
คาความเชอมน (Confidence) คอ คาความนาจะเปนทจะพบกฎความสมพนธในทรานแซคชนทม เซตรายการทมากอนอย จากตวอยางขางตนคาความเชอมนของกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} เทากบ 10/11 = 0.909
นยามการเขยนกฎความสมพนธพรอมระบคาสนบสนนนบ และคาความเชอมน ในรปสญลกษณดงน r [s;c] โดยท r แทนกฎความสมพนธ s แทนคาสนบสนนนบของกฎความสมพนธนน และ c แทนคาความเชอมนของกฎความสมพนธนน ตวอยางเชน {alter(field, fKeys[], …)} {alter(method, initDefaults(), …)} [4;0.57]
สมมตใหนกพฒนามการเปลยนแปลงแกไขบางอยางลงไป ท าใหเกดเซตรายการของการเปลยนแปลงแกไขขนมา นยามเซตรายการของการเปลยนแปลงแกไขดงกลาววาเปนเซตเหตการณ (Situation) และใชสญลกษณ Q แทนเหตการณ เซตเหตการณจะถกปรบปรง (Update) ทกครงทนกพฒนาท าการบนทกการเปลยนแปลงแกไขลงสเครองลกขายของนกพฒนาเอง เมอนกพฒนามนใจในเวอรชนใหมของแตละแฟมขอมลทนกพฒนาแกไขไปแลวท าการคอมมทเพอบนทกการเปลยนแปลงแกไขทงหมดลงสรพอสโทรของระบบคอนเคอเรนทเวอรชน เซตเหตการณสดทายกจะถกเพมเขาไปฐานขอมลทรานแซคชน ตวอยางของเซตเหตการณเชน
Q = {alter(field, fKeys[], …)}
78
สมการขางตนแสดงเซตเหตการณทประกอบดวย 1 รายการการเปลยนแปลงแกไข ระบวานกพฒนาไดท าการเปลยนแปลงเอนทตระดบตวแปรชอ fKey[] ในแฟมขอมล ComparePerferencePage.java (ในสมการขางตนละการเขยนถงเอนท ตแฟมขอมล ComparePerferencePage.java เอาไวโดยแทนทดวย … เพอความสะดวกในการเขยน)
จดมงหมายในการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวของงานวจยนคอ การใหค าแนะน านกพฒนาวาควรจะเปลยนแปลงแกไขทใดตอไปเมอนกพฒนาท าใหเกดเหตการณนนๆขน ในหวขอตอไปนจะอธบายถงขนตอนวธในการสรางกฎความสมพนธจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว และอธบายการสรางค าแนะน าจากกฎความสมพนธทไดมา
2.8.2.1 การสรางกฎความสมพนธจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
ขนตอนวธในการสรางกฎความสมพนธทไดรบความนยมมากทสดกคอ ขนตอนวธอพรโอร (Apriori algorithm) ทถกน าเสนอโดย Agrawal และ Srikant ในป ค.ศ. 1994 (Agrawal and Srikant, 1994) ขนตอนวธอพรโอรนนจ าเปนตองระบคาสนบสนนขนต า (Minimum Support) (ส าหรบงานวจยนเปนคาสนบสนนนบขนต า (Minimum Support Count) แทน) และคาความเชอมนขนต า (Minimum Confidence) เพอใชในการค านวณผลลพธของขนตอนวธอพรโอรคอเซตของกฎความสมพนธทงหมดทมคาสนบสนนนบมากกวาคาสนบสนนนบขนต าและมคาความเชอมนมากกวาคาความเชอมนขนต า
การน าขนตอนวธอพรโอรมาประยกตใชกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวโดยค านวณหากฎความสมพนธทงหมดเอาไวกอนลวงหนาและสรางค าแนะน าทเหมาะสมกบเหตการณทนกพฒนาสรางขน แตวธการดงกลาวสามารถท าใหเกดปญหาตามมาได เนองจากเหตการณใหมๆทเกดขนหลงจากการสรางกฎความสมพนธเกบไวแลวจะไมไดถกน าไปสรางเปน ทรานแซคชนและน าไปเปนสวนหนงของขอมลทใชในการท าเหมองขอมล ดงนนเมอเวลาผานไปเซตของกฎความสมพนธทสรางเอาไวลวงหนาจะไดถกตองตรงกบความเปนจรง วธทถกตองกคอกฎความสมพนธทงหมดจะตองถกค านวณใหมอยเสมอทกครงทนกพฒนาท าใหเกดเหตการณใหมๆ แตในความเปนจรงการค านวณโดยใชขนตอนวธอพรโอรกบขอมลซอฟตแวรอารไคฟวใชเวลานานมาก (ในกรณโครงการใหญๆและผานระยะเวลาการพฒนามานานๆ ตองใชเวลาในการค านวณหลายวน) ป ค.ศ. 2005 Zimmermann และคณะไดเสนอวธการในปรบปรงขนตอนวธอพร
79
โอรมาเพอใหเหมาะสม (Optimization) กบการท าเหมองขอมลของขอมลซอฟตแวรอารไคฟว โดยการเพมขอก าหนด 2 ขอใหกบขนตอนวธอพรโอร (Zimmermann et al., 2005) ดงน
การคนหากฎความสมพนธเฉพาะกฎทมเซตรายการทมากอนทตองการเทานน กลาวคอการท าเหมองขอมลจะเกดขนในขณะทผพฒนาก าลงท าใหเกดเหตการณขนและคนหาเฉพาะกฎความสมพนธทมเซตทเหตการณ Q ทนกพฒนาพงจะกระท าเปนเซตรายการทมากอนของกฎ (Srikant et al., 1997) การกระท าเชนนท าใหการค านวณทงหมดใชเวลาเพยงเลกนอยเทานน ขอดอกประการหนงของการใชการคนหากฎความสมพนธเฉพาะกฎทม เซตรายการ ทมากอนคอ ว ธการน สามารถกระท า ไ ดแบบเพมข นตอ เ นอง (Incrementally) ได จงท าใหเหตการณใหมๆทพงการจะถกน าไปสรางเปนทรานแซคชนและมผลตอการค านวณหากฎความสมพนธในครงถดไป
การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยง 1 รายการเทานน การกระท านท าใหการท าเหมองขอมลเรวขนกวาเดมมาก ดงนนกฎความสมพนธ ทไดหลงจากทนกพฒนากระท าใหเกดเหตการณ Q กคอ Q {e} โดยท e คอสมาชกของเซตรายการทตามมา การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยงรายการเดยวนไมไดสงผลกระทบใหผลลพธของค าแนะน าทจะไดนนผดเพลยนไปเพราะถงแมวาเซตของค าแนะน าทไดจะมสมาชกมากกวา 1 รายการแตนกพฒนากสามารถกระท าตามค าแนะน าไดเพยงครงละ 1 รายการอยด หรอการพสจนทางคณตศาสตรดงน ก าหนดให รายการ e x2 ของกฎความสมพนธ Q x2 [s;c] ดงนนยอมมกฎความสมพนธ r ทมเซตรายการทตามมารายการเดยวคอ กฎความสมพนธ Q {e}[sr;cr] ซง sr ≥ s และ cr ≥ c เนองจาก Q U {e} Q U x2 ท าให จ านวนรายการของ Q U {e} ≥ Q U x2
80
2.8.2.2 การสรางค าแนะน าจากกฎความสมพนธ (Generating Suggestions for
Situation)
การสรางเซตของค าแนะน า (Suggestions) จากเซตของกฎความสมพนธ R ส าหรบเหตการณ Q ทนกพฒนากระท าออกมาสามารถนยามใหอยในรปของการยเนยน (Union) ของเซตรายการทตามมาของกฎความสมพนธ R ทมเซตรายการทมากอนตรงกบเซตเหตการณ Q ดงน
⋃ { }
ตวอยางการสรางค าแนะน าจากกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} ส าหรบเหตการณ Q จะท าใหไดผลลพธคอเซตของค าแนะน าคอ {alter(method, initDefaults(), …), alter(file, plug.properties, …)} โดยทค าแนะน าการเปลยนแปลงแกไขทอยภายในเซตของค าแนะน านนจะถกเรยงล าดบตามคาสนบสนนนบ และคาความเชอมน จ านวนของค าแนะน าภายในเซตของค าแนะน านจะขนอยกบการก าหนดคาสนบสนนนบ และคาความเชอมนขนต า โดยปกตแลวมกจะเรมตนก าหนดคาสนบสนนนบขนต าเปน 1 และคาความเชอมนขนต าเปน 0.1
ในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดตงขอสนนษฐานไววา การใหค าแนะน าในการเปลยนแปลงแกไขกบนกพฒนานน ค าแนะน าทจะไดรบความสนใจจากนกพฒนากคอค าแนะน าทอยใน 10 อนดบแรกเทานน ดงนนในการสรางเซตของค าแนะน าจงควรใหความสนใจกฎความสมพนธทอยใน 10 อนดบแรกโดยเรยงจากคาสนบสนนนบและคาความเชอมนเทานน ดงนนผ วจยจงก าหนดสมการในการสรางเซตของค าแนะน าดงแสดงในสมการตอไปน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธใน
81
เซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
ดงนนขนาดของเซต Aq จะนอยกวาหรอเทากบ 10 เสมอ
Aq =
สมมตวาเมอนกพฒนาเหนเซตของค าแนะน าแลว นกพฒนาจะตดสนใจด าเนนการเปลยนแปลงแกไขตามค าแนะน าแรกเสมอ (ค าแนะน าทมคาความเชอมนสงทสด) เมอนกพฒนากระท าตามค าแนะน านนกจะท าใหเกดเหตการณใหมขนและเหตการณใหมนนกจะถกน าไปสรางเซตของค าแนะน าใหมจากกฎความสมพนธทไดจากการท าเหมองขอมลกบทรานแซคชนทงหมดทรวมเอาเหตการณครงกอนหนาเอาไวดวย
ขนตอนวธทกลาวมาทงหมดในหวขอ 2.8.1 และ 2.8.2 น ไดถกน าไปสรางเปนระบบใหค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรชอโปรแกรมประยกตอโรส (eROSE) โดย Zimmermann และคณะ (Zimmermann et al., 2005) โปรแกรมประยกตอโรสประกอบดวย 3 สวน คอ 1) สวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 2) สวนการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว และ 3) สวนการใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร
2.9 การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนสามารถกระท าไดในสถานการณทแตกตางกน 3 สถานการณ ไดแก 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไปไดถกตองหรอไม 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทต หลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนไดถกตองหรอไม 3) สถานการณการ
82
เปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะใหค าแนะน าทเปนผลบวกลวง (False Positive) เปนผลลพธแกนกพฒนาหรอไม
การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวใชวธการวดประสทธภาพเหมอนกบการวดประสทธภาพของการคนคนขอมล (Information Retrieval) (Zimmermann et al., 2005) กคอการค านวณหาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของแตละหนวยทดลอง จากนนน าคาความถกตอง (Precision) และคาเรยกคน (Recall) ทไดมาค านวณหาคาเอฟเมสเชอร (F-measure) ซงคาเอฟเมสเชอรนกคอคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการน าทาง (Navigation) และสถานการณการปองกนการเกดขอผดพลาด (Error Prevention) นนเอง นอกนนผวจยยงสามารถค านวณคาผลสะทอนกลบ (Feedback) หรอคารอยละของขอสอบถามทไมไดใหเซตรายการการเปลยนแปลงแกไขทถกดงขนมาเปนเซตวางกบขอสอบถามทงหมด ซงคาผลสะทอนกลบนกคอคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบ ขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
การใชคาเอฟเมสเชอรเปนคาทใชการระบระดบประสทธภาพของการคนคนขอมลเปนทนยมในงานวจยทเกยวของกบการคนคนขอมล เชน งานวจยการขยายค าในขอสอบถามโดยรวมกฎความสมพนธกบสงทศกษารวมกบเทคนคการคนคนสารสนเทศ (Song et al., 2005) และงานวจยการจดกลมเอกสารทางเวบโดยใชเซตรายการทมากทสด (Zhuang and Dai, 2004) เปนตน นอกจากนนงานวจยของ Methanias และคณะ (Methanias et al., 2009) ทท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) กใชคาเอฟเมสเชอรเปนคาทใชการระบระดบประสทธภาพเชนกน คาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure) นนสามารถค านวณไดดงน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการ
83
การเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
ดงนนขนาดของเซต Aq จะนอยกวาหรอเทากบ 10 เสมอ
2.9.1 คาความถกตอง (Precision)
คาความถกตอง (Precision) เปนสดสวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยใน เซตผลลพธทคาดไว เทยบกบรายการการเปลยนแปลงแกไขทงหมดทถกดงขน ดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให |Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
|Aq| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมา
ในกรณทเซตรายการการเปลยนแปลงแกไขทถกดงขนมาเปนเซตวาง (|Aq| = 0) จะก าหนดใหคาความถกตองมคาเทากบ 1
2.9.2 คาเรยกคน (Recall)
คาเรยกคน (Recall) เปนสดสวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว เทยบกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว ดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให |Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
84
|E| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
ในกรณทเซตผลลพธทคาดไวเปนเซตวาง (|E| = 0) จะก าหนดใหคาความถกตองมคาเทากบ 1
2.9.3 คาเอฟเมสเชอร (F-measure)
คาเอฟเมสเชอร (F-measure) หรอคาเอฟเมสเชอรแบบถวงน าหนก (Weighted Harmonic mean of Precision and Recall) ถกเสนอขนโดย Rijsbergen ในป ค.ศ. 1979 (Rijsbergen, 1979) คอ คาทใชในการประเมนความถกตองแมนย า (accuracy) ของการทดสอบซงพจารณาจากทงคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการทดสอบโดยมการถวงน าหนกใหกบคาทงสองดวย คาเอฟเมสเชอรมพสยอยระหวาง 0 กบ 1 คาเอฟเมสเชอรทเทากบ 1 แสดงวามความถกตองแมนย ามากทสด สวนคาเอฟเมสเชอรทเทากบ 0 แสดงวามความถกตองแมนย านอยทสด สมการรปทวไปของคาเอฟเมสเชอรแสดงไดดงตอไปน (Tsunenori, 2003)
ก าหนดให F คอ คาเอฟเมสเชอร (F-measure) Precision คอ คาความถกตอง
Recall คอ คาเรยกคน คอ คาอตราสวนน าหนกของคาความถกตองตอคาเรยกคน
โดยท คา β หรอคาอตราสวนน าหนกของคาความถกตองตอคาเรยกคนเปนจ านวนจรงบวก ตวอยางของการก าหนดคา เชน คา β = 1 หมายความวาใหน าหนกของคาความถกตองกบคาเรยกคนมน าหนกความส าคญเทากน คา β = 2 หมายถงก าหนดใหคาความถกตองมน าหนกความส าคญเปนสองเทาเมอเทยบกบคาเรยกคน และคา β = 0.5 หมายถงก าหนดใหคาเรยกคนมน าหนกความส าคญเปนสองเทาเมอเทยบกบคาความถกตอง เปนตน ส าหรบทก าหนดให β = 1 นนคาเอฟเมสเชอรจะถกเรยกวา คาบาลานซเอฟเมสเชอร (balanced F-score) หรอคาเอฟหนง
85
สกอร (F1 score) หรอกคอคาเอฟเมสเชอรทถวงน าหนกอยางสมดลนนเอง สมการของคาเอฟหนงสกอรแสดงไดดงน (Tsunenori, 2003)
ก าหนดให F1 คอ คาเอฟหนงสกอร (F1 score) Precision คอ คาความถกตอง
Recall คอ คาเรยกคน
คาเอฟเมสเชอรเปนคาทนยมใชในการวดประสทธภาพของการคนคนขอมล (Information Retrieval) อยางแพรหลาย (Tsunenori, 2003) งานวจยทเกยวของกบการคนหากฎความส าคญหลายงานวจย (Beil et al., 2002; Geyer-Schulz and Hahsler, 2002) แนะน าใหใชคาเอฟหนงสกอรหรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล
ในป 2005 งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวกบโครงการพฒนาระบบปฏบตการคอมพวเตอรตางๆ (Operating system) และกลาววา จดมงหมายของการทดสอบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรคอคาความถกตองทสง (คาใกลเคยง 1) และคาเรยกคนทสง (คาใกลเคยง 1) นนคอตองการใหระบบสามารถแนะน าค าแนะน าทงหมด (คาเรยกคนเทากบ 1) และแตละค าแนะน านนถกตองหรอตรงกบเซตผลลพธทคาดไวทงหมด (คาความถกตองเทากบ 1) ดงนนงานวจยของ Zimmermann และคณะจงใชคาเฉลยฮารโมนนคของคาความถกตองและคาเรยกคน (Harmonic mean of Precision and Recall) หรอกคอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล เปนคาประเมนประสทธภาพของการท าเหมองขอมล (Zimmermann et al., 2005)
ตอมาในป 2009 งานวจยของ Methanias และคณะ (Methanias et al., 2009) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) ใน 3 สถานการณเชนเดยวกน และแนะน าใหใชคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลส าหรบการประเมนประสทธภาพในสถานการณการน าทางและสถานการณการปองกนขอผดพลาด (Methanias et al., 2009)
86
2.9.4 คาผลสะทอนกลบ (Feedback)
คาผลสะทอนกลบ (Feedback) คอ คารอยละของเซตรายการการเปลยนแปลงแกไขทถกดงขนมาทไมใชเซตวางกบเซตรายการการเปลยนแปลงแกไขทถกดงขนมาทงหมด คาผลสะทอนกลบแสดงไดดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให คอ คาผลสะทอนกลบ
|Z*| คอ จ านวนขอสอบถามทอยในเซตของขอสอบถามทมเซตของค าแนะน าทไมเปนเซตวาง โดยท Z* = {q | q = (Q, E) Z,
≠ } |Z| คอ จ านวนขอสอบถามทงหมด โดยท Z = {q | q = (Q, E) }
เมอน าคาผลสะทอนกลบมาใชประเมนในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะสามารถแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวงนนเอง เนองจากคาผลสะทอนกลบมพสยอยระหวาง 0 กบ 1 คาผลสะทอนกลบทมคาเทากบ 0 หมายถงไมมขอสอบถามใดเลยทใหค าแนะน าทเปนผลบวกลวงออกมาในสถานการณนนนคอมประสทธภาพดทสด และคาผลสะทอนกลบทมคาเทากบ 1 หมายถงขอสอบถามทงหมดใหค าแนะน าทเปนผลบวกลวงออกมานนคอมประสทธภาพไมดทสด ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนจะตองเปรยบเทยบคาผลสะทอนกลบและคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพดกวา (Zimmermann et al., 2005)
87
บทท 3 ระเบยบวธวจย………
3.1 บทน า
ในบทนจะกลาวถงระเบยบวธวจยซงประกอบดวยการอธบายแผนแบบการทดลอง (Experimental Design) การทดสอบสมมตฐาน การท างานของเครองมอทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ ทงานวจยก าหนด รวมทงวธการพฒนาเครองมอทดสอบประสทธภาพของการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ประเดนความนาเชอถอได (Reliability) ความถกตอง (Validity) และกรอบการวเคราะหขอมล (Data Analysis Framework) ดงรายละเอยดตอไปน
3.2 แผนแบบการทดลอง
งานวจยนมวตถประสงคในการทดลองเพอศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไปไดถกตองหรอไม 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทต ตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนไดถกตองหรอไม 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะใหค าแนะน าทเปนผลบวกลวง (False Positive) ออกมาแกนกพฒนาหรอไม
88
จากวตถประสงคงานวจยทกลาวขางตน ผ วจยจงเลอกใชแผนแบบการทดลองแบบการเปรยบเทยบกลมสถต (Static Group Comparison) ซงเปนแผนแบบการทดลองทเหมาะสมกบการทดลองทตองการวดคาตวแปรตามของกลมควบคมและกลมทดลองหลงจากท าการทดสอบมคาแตกตางกนอยางไร นนคอ การวดคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนดงเดม (กลมควบคม) กบคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) (กลมทดสอบ) หลงจากการทดสอบวามคาแตกตางกนอยางไร โดยก าหนดใหมตวแปรในการทดลองเปรยบเทยบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทตองการทดสอบ ดงตอไปน
3.2.1 ตวแปรตน
งานวจยนสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอ (IDE: Integrated Development Environment) ไดหรอไม ดงนนตวแปรตนของการศกษาครงนคอตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธทงหมด 2 ตวแบบ ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model)
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Support-New Confidence Model) (Liu et al., 2008)
จากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบขางตน ผ วจยจะเรยกการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน ดวยค าวา “การคนหากฎความสมพนธดวยตวแบบท 1” สวนการท าเหมองขอมลดวยเทคนคการคนหากฎ
89
ความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) จะเรยกวา “การคนหากฎความสมพนธดวยตวแบบท 2”
3.2.2 ตวแปรตาม
เนองจากงานวจยนสนใจเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 2 ตวแบบดงกลาวขางตน ดงนนการเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะพจารณาจากความถกตองแมนย าในการท านายและใหค าแนะน ากบนกพฒนาในระหวางการพฒนาซอฟตแวรมากนอยเพยงใด โดยการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในแตละสถานการณมวธการในการประเมนทแตกตางกนออกไปดงน
ในสถานการณ การน าทาง (Navigation) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) ซงรายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเ รยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การปองกนการเกดขอผดพลาด (Error Prevention) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) ซงรายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การเปลยนแปลงแกไขทสมบรณแลว (Closure) สามารถประเมนประสทธภาพจากคาผลสะทอนกลบ (Feedback) ซงรายละเอยดและวธการค านวณคาผลสะทอนกลบส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
90
3.3 สมมตฐานงานวจย
จากวตถประสงคของงานวจย ผ วจยตองการทดสอบวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในสถานการณตางๆกน 3 สถานการณคอ สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) ไดหรอไม ดงนนงานวจยนจงตองการศกษาประสทธภาพของการใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรทไดมาจากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบตามทก าหนดไวในหวขอตวแปรตน โดยผวจยจะตงสมมตฐานในแตละสถานการณจะทท าการทดสอบไวดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
ผ วจยตองการทราบวาคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผ วจยจงเปรยบเทยบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจากการคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท าเหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการ
91
คนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง จงตงสมมตฐานไว ดงน
H0 : ≤
H1 : >
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
ผ วจยตองการทราบวาคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผ วจยจงเปรยบเทยบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจากการคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท า
92
เหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด จงตงสมมตฐานไว ดงน
H0 : ≤
H1 : >
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ผวจยตองการทราบวาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผวจยจงเปรยบเทยบคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจาก
93
การคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท าเหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการคนหากฎความสมพนธดวยตวแบบท 2 นนจะใหคาผลสะทอนกลบทนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว จงตงสมมตฐานไว ดงน
H0 : ≥
H1 : <
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
3.4 ประชากรและหนวยตวอยาง
ส าหรบงานวจยนขอมลซอฟตแวรอารไคฟวทไดจากระบบคอนเคอเรนทเวอรชนนนเปนประชากรของการทดลองในงานวจยน ซงผ วจยหวงวาจะทดสอบระบบกบ ขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทงหมด แตในทางปฎบตนนผ วจยไม สามารถน าขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทพฒนาขนในเชงพาณชยได ดงนนผ วจยจงเลอกใชขอมลซอฟตแวรอารไคฟวจากระบบคอนเคอเรนทเวอรชนในโครงการพฒนาซอฟตแวรทเปนโครงการโอเพนซอรส (Open Source Project) จ านวน 1 โครงการคอโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) มาเพอเปนหนวยตวอยางของงานวจยน รายละเอยดของซอฟตแวรนแสดงดงตารางตอไปน
94
ตารางท 3-1 แสดงรายละเอยดของซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) เกบขอมลในวนท 10 มกราคม พ.ศ. 2553
ขอมลทวไป ประเภทซอฟตแวร การบญช การจดท าและการพยากรณงบประมาณ ผบ ารงรกษา โทมส โบมการท และ มเชล เอดเวรด ประเภทลขสทธ จพแอล (GPL) ผใชเปาหมาย ผใชทวไป องคกรไมแสวงหาผลประโยชน ขนาดซอฟตแวร 14.2 เมกะไบต จ านวนการถกบรรจลง (ครง) 223,889
ขอมลดานเทคนค ภาษาทใชในการพฒนา ซพลสพลส (C++)
แพลตฟอรมทรองรบ ลนกซ (Linux) ยนกซ (Unix) และฟรบเอสด (FreeBSD)
สวนตดตอผใช เคดอ (KDE), ควท (Qt)
ฐานขอมลทสนบสนน มายเอสควแอล (MySQL) โพสตเกรสเอสควแอล (PostgreSQL) และ เอสควแอลไลท (SQLite)
ขอมลจากระบบคอนเคอเรนทเวอรชน (CVS) วนทเรมตนโครงการ 16/04/2000 วนทปรบปรงลาสด 28/12/2009 ระยะเวลา (ป) 9.7 จ านวนนกพฒนา (คน) 10 จ านวนทรานแซคชน (ทรานแซคชน) 28261 จ านวนแทก (แทก) 30777 จ านวนแฟมขอมล (แฟม) 2583 จ านวนไดเรกทอร 118 จ านวนเอนทต (เอนทต) 21660 จ านวนเอนทตตอแฟมขอมลโดยเฉลย (เอนทต/แฟมขอมล)
8.4
95
จ านวนกงกาน (กง) 636 ขอมลโครงสรางของซอฟตแวร
จ านวนเนมสเปส (เนมสเปส) 7 จ านวนคลาส อนเตอรเฟส สตรคท และยเนยน (คอมโพเนนท)
543
จ านวนฟงกชน (ฟงกชน) 4472 จ านวนตวแปร (ตวแปร) 2896 จ านวนไทพดฟ (ไทพดฟ) 27 จ านวนอนมมเรชน (อนมมเรชน) 112 จ านวนอนมมเรเตอร (อนมมเรเตอร)
962
จ านวนพรอพเพอรต (พรอพเพอรต) 10
ซอฟ ตแว ร เ คมายมน น (KMyMoney) ค อ ซอฟตแว รจดการการ เ ง น (Finance Management Software) ทสามารถรองรบการใชงานในระดบบคคลและระดบองคกรขนาดเลกได ถกพฒนาขนมาดวยภาษาซพลสพลส (C++) บนเครองมอทชอวาควท (Qt) ท าใหเปนโปรแกรมประยกตทพฒนาขนคร งเดยวแตท างานไดบนระบบปฏบตการตระกลยนกซเกอบทกรน ซอฟตแวรเคมายมนนแบงกลมของการจดการขอมลออกเปน 10 สวนดงน
1. สถาบนทางการเงน (Institutions) คอ สวนทผ ใชสามารถบรหารจดการบญชของผ ใชโดยแบงแยกตามสถาบนทางการเงนหรอธนาคารของแตและบญชทมอย ในสวนนผ ใชสามารถสราง แกไข ลบ หรอเปดดขอมลการเงนของแตละบญชในสถาบนทางการเงนหรอธนาคารไดตามตองการ
2. บญช (Accounts) คอ สวนทผ ใชสามารถบรหารจดการบญชของผ ใชโดยแบงแยกตามประเภทของแตและบญชทมอย เชน บญชทรพยสน บญชหนสน เปนตน ในสวนนผ ใชสามารถสราง แกไข ลบ หรอเปดดขอมลการเงนของแตละบญชไดตามตองการ
3. ตารางเวลา (Schedules) คอ สวนทผ ใชสามารถสรางและจดการตารางเวลาการท าธรกรรมทางการเงนได ผ ใชสามารถสรางตารางเวลาลวงหนา ตงตารางเวลา
96
แบบซ าเปนรอบวน รอบสปดาห หรอรอบเดอน ชวยใหผ ใชไมลมและสามารถท าธรกรรมไดตรงตามเวลา นอกจากนนผ ใชสามารถก าหนดใหธรกรรมทอยบนตารางเวลานนไปปรากฏบนบญชแยกประเภท (Ledgers) ไดดวย
4. หมวดการท าธรกรรม (Categories) คอ สวนทผ ใชสามารถ แกไข หรอลบหมวดของการท าธรกรรม เชน หมวดธรกรรมดานศกษา หมวดธรกรรมทวไป เปนตน ผใชสามารถดงขอมลธรกรรมทจดท าไวในสวนอนๆมาจดหมวดหมในสวนน
5. ผ รวมท าธรกรรม (Payees) คอ สวนทผ ใชสามารถจดการขอมลของบคคล กลมบคคล หรอองคกร ทผ ใชไปท าธรกรรมดวย ในสวนนผ ใชสามารถเรยกดรายการท าธรกรรมทงหมดโดยแบงแยกตามบคคล กลมบคคล หรอองคกร ทผ ใชไปท าธรกรรมดวยได
6. บญชแยกประเภท (Ledgers) คอ สวนทผ ใชสามารถจดการรายการธรกรรมของผ ใช ลกษณะเดยวกบโปรแกรมไมโครซอฟตมนน (Microsoft Money) นอกจากนนยงมความสามารถพเศษทชอวาเลคเจอะเลนส (ledger lens) ใชส าหรบเลอกรายการธรกรรมตงแตหนงถงสามรายการเพอขยายดรายละเอยดภายในของรายการธรกรรมนนๆ ขอมลรายการธรกรรมทงหมดสามารถเลอกใหเรยงล าดบรายการตามคอลมภทตองการได
7. การลงทน (Investments) คอ สวนทผ ใชสามารถตดตามการลงทนพนฐานตางๆได เชนการตดตามราคาหน ราคาทองค า อตราแลกเปลยนเงนตราตางประเทศ และกองทนตางๆ ผใชสามารถเลอกเพม แกไขหรอลบรายการการลงทนทตองการตดตามได
8. รายงานทางการเงน (Reports) คอ สวนทผ ใชสามารถจดท าเอกสารรายงานทางการเงนตางๆได โดยทผใชสามารถเลอกก าหนดคาองคประกอบตางๆไดอยางอสระ ในเวอรชนปจจบนผ ใ ชสามารถสรางกราฟ แผนภาพแบบตางๆในเอกสารรายงานไดดวย
9. งบประมาณ (Budgets) คอ สวนทผ ใชสามารถจดการหมวดหมของรายการรายไดและคาใชจายทคาดหวงไวในภายในชวงของเวลาทก าหนด ผ ใชสามารถก าหนดชวงของเวลาได 3 แบบคอ รายป รายเดอน หรอระยะเวลาเฉพาะทก าหนดเอง นอกจากนนระบบยงสามารถสรางรายงานแสดงการเปรยบเทยบรายไดและรายจายจรงกบและรายไดและรายจายทคาดหวงไวได
97
10. การพยากรณทางการเงน (Forecast) คอ สวนทผ ใชสามารถเรยกดการพยากรณทางการเงนของแตละบญชทผใชมอยได การพยากรณทางการเงนในทนหมายถงการคาดการณยอดเงนคงเหลอของแตละบญชในจดเวลาอนาคต การพยากรณของระบบเกดขนมาจากขอมลทบนทกในสวนตารางเวลาและสวนบญชแยกประเภทปจจบน รวมถงการรวบรวมธรกรรมทเคยเกดขนในอดตมาพจารณาดวย
จากตารางแสดงรายละเอยดดานตางๆและหนาทการท างานทอธบายไปในขางตนของซอฟตแวรชอเคมายมนน ผวจยเหนวาซอฟตแวรชอเคมายมนนมขนาดใหญ มความซบซอนมากในระดบหนง มนกพฒนาผ รวมโครงการเปนจ านวนมาก และมโอกาสทจะมนกพฒนาใหมเขารวมโครงการไดเสมอ นอกจากนนซอฟตแวรชอเคมายมนนนนพฒนาขนมาดวยภาษาซพลสพลส (C++) ซงเปนภาษาเชงวตถ (Object Oriented Programming Language) ผวจยจงหวงวาซอรสโคดของโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) จะสามารถเปนตวแทนทดของซอฟตแวรขนาดใหญทถกพฒนาดวยภาษาเชงวตถ และมนกพฒนาผ รวมโครงการเปนจ านวนมากได ดงนนผ วจยจงเลอกขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรชอเคมายมนนน เปนขอมลทใชในการทดสอบของงานวจยน
สาเหตทงานวจยนเลอกตวอยางขอมลซอฟตแวรอารไคฟวเพยงตวอยางเดยว เนองจากงานวจยนตองการวจยเพอหาขอมลเบองตน (Exploratory Research) เพอประโยชนในการวจยในอนาคตเทานน ไมไดตองการสรปผลใหครอบคลมการน าไปประยกตกบกรณทวไป
3.5 แนวทางการท าวจย
งานวจยนเปนงานวจยเชงทดลอง (Experimental Research) เนองจากเปนการทดลองเพอเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบ 2 ตวแบบใน 3 สถานการณ ส าหรบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนตวแบบทมประสทธภาพดกวาคอตวแบบทใหคาเอฟเมสเชอรทสงกวา และส าหรบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนตวแบบทมประสทธภาพดกวาคอตวแบบทใหคาผลสะทอนกลบทนอยกวา โดยในงานวจยนสนใจวาการคนหากฎความสมพนธดวยตวแบบท 2 หรอการใชตวแบบคาสนบสนน-คาความเชอมนใหม
98
ของ Liu และคณะ (Liu et al., 2008) ในการท าเหมองขอมลนนจะสามารถชวยเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวรทไดมาจากผลของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวได ในงานวจยเชงทดลองนจะควบคมตวแปรอนๆ ใหเหมอนกนหมดนนคอ ขอมลซอฟตแวรอารไคฟว ขอสอบถาม ความถกตองระหวางขอมลซอฟตแวรอารไคฟวและขอสอบถาม และเครองมอทใชในการจดเตรยมขอมลเพอการท าเหมองขอมล (Data preprocessing tool) และเครองมอในการท าเหมองขอมล (Data Mining tool) เพอใหตวแปรควบคมทก าหนดนนมผลกระทบกบตวแปรตามนอยทสดและผลของงานวจยจะไดเปนผลทเกดจากการเปลยนแปลงตวแปรตนอยางแทจรง นนคองานวจยจะทดลองวาผลลพธของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะมประสทธภาพเปลยนแปลงไปอยางไรเมอใชตวแบบในการท าเหมองขอมลแตกตางกนส าหรบสถานการณตางๆ โดยไดสรางเครองมอเพอทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008)
งานวจยนไดพฒนาระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวออกเปน 2 ตวแบบดงกลาว เนองจากผวจยสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะนนสามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอไดหรอไม ดงนนในการทดลองจงตองพฒนาระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนดงเดมไวเปนกลมควบคม เพอเปนกลมเปรยบเทยบกบระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะซงเปนกลมทดสอบ ส าหรบสถานการณทง 3 สถานการณ
99
3.6 ขนตอนทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
1 2 3
Source CodeFile
CVS logFile
1
2
3
1
2
3
1 2
1
2
1 1
1 2
1 3
2 1
2 2
2 3
1
2
3
1 1
1 2
1 3
2 1
2 2
2 3
รปท 3-1 แสดงขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
100
การออกแบบการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของงานวจยนมขนตอนการท างานทงหมดแสดงดงรปท
3-1 ซงการทดสอบในครงนจะแบงขนตอนในการทดสอบออกเปน 6 ขนตอน คอ
1) การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 2) การสรางขอสอบถามส าหรบการทดสอบ 3 สถานการณ 3) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวร
อารไคฟวทง 2 ตวแบบส าหรบ 3 สถานการณ 4) การสรางเซตของค าแนะน าส าหรบเหตการณ 5) การประเมนผลการทดสอบ 6) การทดสอบสมมตฐาน
รายละเอยดขอมลเขา กระบวนการท างานและขอมลออกของแตละขนตอนการทดสอบอธบายดงตอไปน
3.6.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอ สวนทท าหนาทในการดงแฟมขอมลซอรสโคดและแฟมขอมลบนทกจากรพอสโทรของระบบคอนเคอเรนทเวอรชนแลวน าแฟมขอมลเหลานนมาผานกระบวนการ 4 กระบวนการเพอใหไดขอมลทรานแซคชนของการเปลยนแปลงแกไข ดงน
1) การสกดขอมล (Data Extraction)
2) การซอมแซมทรานแซคชน (Restoring Transactions)
3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
4) การก าจดสงแปลกปลอม (Data Cleaning)
ขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 4 กระบวนการขางตนถกเสนอขนมาโดย Zimmermann และคณะ ในป 2004 (Zimmermann et al., 2004) และเปนขนตอนวธทมงานวจยทเกยวของกบการท าเหมองขอมลกบขอมลซอฟตแวรอาร
101
ไคฟวหลายงายวจย (Zimmermann et al., 2005; Livshits et al., 2005; Williams et al., 2005; Breu et al., 2006; Weißgerber et al, 2006) น าไปใช งานวจยนน าขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทง 4 กระบวนการมาใชเชนกน และก าหนดรายละเอยดตางๆของแตละกระบวนการเหมอนกบท Zimmermann และคณะไดเสนอไว (Zimmermann et al., 2004) ผวจยจะอธบายกระบวนการท างานพรอมกบยกตวอยางบางสวนประกอบการอธบาย เพอเพมความเขาใจในการท างานของแตละกระบวนการมากขนดวย
การสกดขอมล (Data Extraction)
การสกดขอมลจากแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชนเรมตนจากการเรยกใชค าสง CVS log จากไดเรคทอรราก (root directory) ของโครงการพฒนาซอฟตแวรทตองการ ผลลพธทสงกลบคนมากคอขอมลแฟมขอมลซอรสโคดและแฟมขอมลบนทก (Log File) ทบนทกอยบนรพอสโทรของระบบคอนเคอเรนทเวอรชนนน แฟมขอมลบนทกทไดมาจะถกน ามาวเคราะหรปแบบไวยากรณ (Parse) และถกน าไปบนทกลงฐานขอมล (Zimmermann et al., 2004)
ขอมลเขา คอ แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File)
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (ฐานขอมลทประกอบดวยตาราง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions)
กระบวนการท างาน สามารถอธบายไดโดยแผนภาพตอไปน (Zimmermann et al., 2004)
102
รปท 3-2 แสดงตวอยางแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน
รปแบบไวยากรณ แอททรบวต และความหมายของแตละแอททรบวต อธบายไวในบทท 2 รายละเอยดของขอมลทงหมดทจะถกบนทกเอาไวจากขนตอนการสกดขอมลสามารถอธบายไดดงตอไปน
- แอททรบวต RCS file ของแตละสวน (Sections) ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอและรายละเอยดของแฟมขอมล (Files) และไดเรคทอร (Directories) ทงหมดของโครงการ จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยน (Record) ใหมขนมาในตารางชอ Files และ Directories ดงน
ตวอยางระเบยนของตารางชอ Directories
DirectoryID DirectoryName Depth 1 /org.eclipse.jdt.core/Model/org/elipse/jdt/core/ 6
ตวอยางระเบยนของตารางชอ Files
FileID FileName DirectoryID FileExtension Depth NumberOfRevisions 1 IBuffer.java 1 .java 7 0
103
- แอททรบวต description ประกอบดวยสวนยอยหลายสวนแตละสวนแสดงถงการเปลยนแปลงแกไขแตละครงทเกดขน ขอมลในแตละสวนยอยนสามารถสกดขอมลออกมาเปนรายการการเปลยนแปลงแกไขแฟมขอมล (Revisions) ได จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Revisions ดงน
ตวอยางระเบยนของตารางชอ Revisions
FileID RevisionID TransactionID CheckinTime Plus Minus State BranchPrefix 1 1.17 1 2004-01-13
15:48:42 1 1 Exp NULL
- รายการการเปลยนแปลงแกไขแฟมขอมลทไดมาขางตนจะถกน ามาพจารณาวารายการใดบางทเกดขนในเวลาเดยวกนและเกดขนโดยนกพฒนาคนเดยวกนจะถกรวมกนไวเปนทรานแซคชนของการเปลยนแปลงแกไข (Transactions) เดยวกน จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Transactions ดงน
ตวอยางระเบยนของตารางชอ Transactions
TransactionID Author Message MessageMD5 BeginTime EndTime IsNoise 1 jlanneluc Updated
copyrights to 2004
817397A1A 8F94C3C8 1AF1C5DB E9F37F7
2004-01-13 15:48:42
2004-01-13 15:48:42
N
- แอททรบวต symbolic name แตละสวนยอยของแอททรบวต description ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอของแทก (Tags) ทนกพฒนาตงไวใหกบการเปลยนแปลงแกไขนนๆได จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Tags ดงน
104
ตวอยางระเบยนของตารางชอ Tags
FileID TagName RevisionID 1 1.16 v_396a
- ตารางชอ Branches ในฐานขอมลนนจะบนทกจดตอกง (Branch Points) และชอของการตอกง (Branch Names) ขอมลทง 2 ขอมลนถกเกบมาจาก 2 สวนของขอมลทไดจากการเรยกค าสง CVS log โดยทชอของการตอกงกคอชอทเปนสญลกษณทมหมายเลขปรากฎอยดวย ตวอยางเชน JDK_1_5 มหมายเลขเวอรชนเปน 1.15.0.2 จะไดชอของการตอกงน เปน 1.15.2 สวนจดตอกงนนไดมาจากตารางแฮช (Hash Map) ทใชชอของการตอกงเปนคย
ตวอยางระเบยนของตารางชอ Branches
FileID BranchPrefix OriginRevision BranchName InternalRevision 1 1.15.2 1.15 JDK_1_5 1.15.0.2
การซอมแซมทรานแซคชน (Restoring Transactions)
การเขาไปอานขอมลทถกบนทกเอาไวในแฟมขอมลบนทก (Log File) ตางๆบนเครองแมขายของระบบคอนเคอเรนทเวอรชนวามขอความบนทก (Log Message) ใดบางทระบการเปลยนแปลงแกไขทงหมดทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกน ขอมลการเปลยนแปลงแกไขทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกนจะถกน ามาแปลงเปนทรานแซคชน 1 ทรานแซคชนแลวบนทกลงในตาราง Transactions บนฐานขอมล ค าวา ในเวลาเดยวกน ในทนนนหมายรวมถงในเวลาทใกลเคยงกนดวย เนองจากการคอมมทในแตละครงอาจใชเวลาในการด าเนนการหลายวนาทหรอหลายนาท โดยเฉพาะอยางยงการคอมมททละหลายๆแฟมขอมล (Zimmermann et al., 2004) ดงนนในทางปฏบตแลวนอกจากการพจารณาทการคอมมทในเวลาเดยวกนแลวยงตองมวธการพจารณาทการคอมมทระหวางชวงของเวลา (Time Interval) เดยวกนดวย วธการพจารณาการเปลยนแปลงแกไขระหวางชวงของเวลานนม 2 วธคอวธ
105
ก าหนดกรอบเวลาทแนนอน (Fixed Time Windows) และวธเลอนกรอบเวลา (Sliding Time Windows) ตามทไดอธบายอยางละเอยดในบทท 2 (Zimmermann et al., 2004)
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไขและขอมลทเ กยวของอนๆ (ฐานขอมลทง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions ทถกปรบปรงขอมลใหม)
กระบวนการท างาน ส าหรบในการทดสอบครงนผวจยเลอกใชวธเลอนกรอบเวลา (Sliding Time Windows) แบบเดยวกบทงานวจยในอดตหลายๆงานวจยเลอกใช (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Zimmermann et al., 2005; Kim et al., 2005; Breu et al 2006) หลกการของวธการน คอ การก าหนดชองวางระหวางการเปลยนแปลงแกไข (Revision, Change) 2 ครงทมากทสด จดเรมตนของกรอบของชวงเวลาจะถกเลอนไปทการเปลยนแปลงแกไขครงตอไปเสมอตราบใดทการเปลยนแปลงแกไขครงตอไปนนมจดเรมตนอยภายในกรอบเวลาของการเปลยนแปลงแกไขครงกอนหนา
จากขอมลของการเปลยนแปลงแกไขทบนทกไวในตารางชอ Revisions และขอมลทรานแซคชนทอยในตารางชอ Transactions จะตองถกดงขนมาพจารณาระบทรานแซคชนทถกตองใหมทงหมดตามวธเลอนกรอบเวลาขางตนโดยทในการทดสอบครงนผ วจยก าหนดใหความกวางของกรอบเวลาทพจารณาอยท 200 วนาท เชนเดยวกบงานวจยอนๆในอดต (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Zimmermann et al., 2005; Kim et al., 2005; Breu et al 2006) ส าหรบทกการเปลยนแปลงแกไข α1, α2, …, αk (เรยงตามล าดบเวลาทบนทก (time(αi)) ) ทเปนสวนหนงของทรานแซคชน T เดยวกนนน จะตองอยภายใตเงอนไข
{ }
นอกจากนนการเปลยนแปลงแกไขของแตละแฟมขอมลจะปรากฏอยบน 1 ทรานแซคชนไดเพยงครง เดยว เ นองจากระบบคอนเคอเรนทเวอรชน ไมอนญาตใหมการคอมมทการ
106
เปลยนแปลงเวอรชนของแฟมขอมลเดยวกน 2 ครงในเวลาเดยวกนได ดงนนจงมเงอนไขเพมมาอก 1 ขอดงน
เมอพจารณาทรานแซคชนทงหมดเรยบรอยแลวการท าการแกไขระเบยนภายในตารางชอ Transactions ใหมใหถกตอง
ตวอยางการท างานของวธเลอนกรอบเวลา แสดงไดดงตอไปน (Zimmermann et al., 2004)
รปท 3-3 แสดงตวอยางการพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา
รปท 3-3 แสดงการพจารณาดวยวธเลอนกรอบเวลา โดยเรมตนกรอบเวลาทมชวงแนนอนเรมตนทจดของการเปลยนแปลงแกไขทแฟมขอมล IBuffer.java เวอรชนท 1.16 และกรอบเวลาถกเลอนไปเรอยๆ จนสนสดดงรป ดงนนการเปลยนแปลงแกไขทแฟมขอมล IBuffer.java เวอรชนท 1.16 แฟมขอมล Product.java เวอรชนท 1.1 แฟมขอมล Sale.java เวอรชนท 1.27 แฟมขอมล Shop.java เวอรชนท 1.12 และ แฟมขอมล Customer.java เวอรชนท 1.01 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน
การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
ขอมลทถกจดเกบไวในรพอสโทรของระบบคอนเคอเรนทเวอรชนนนมเพยงขอมลแฟมขอมลทกแฟมขอมลในโครงการและขอมลการเปลยนแปลงแกไขในระดบแฟมขอมล (File) หรอคลาส (Class) ทเกบอยในรปของแฟมขอมลบนทก (Log File) เทานน แตไมมบนทกวาการ
107
เปลยนแปลงแกไขทเกดขนนนเกดขนกบฟงกชน (Function) หรอ เมธอด (Method) ใดบาง มตวแปร (Variable) ใดถกเพมเขามา แกไข หรอถกลบออกไปบาง วธการทมความแมนย าสงกวาแตกมคาใชจายในการค านวณสงวธหนง คอการก าหนดเอนทต (ตวแปร ฟงกชนหรอเมธอด) ทงหมดภายในแฟมขอมลทง 2 เวอรชนโดยการน าไปผานตววเคราะหไวยากรณ (Parser) จากนนกท าการเปรยบเทยบซอรสโคดของเอนทตเดยวกนใน 2 เวอรชน หรอกลาวคอเปนการประยกตใชฟงกชนดฟฟ (diff) (Miller et al., 1985) ในระดบของเอนทตนนเอง (Zimmermann et al., 2004)
ขอมลเขา คอ แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File) แฟมขอมลซอรสโคดทกเวอรชนของโครงการ และฐานขอมลตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions และตารางชอ Revisions ทถกเพมระเบยบใหมเขาไป หรอถกปรบปรงขอมลใหม)
กระบวนการท างาน สามารถด าเนนการไดดงตอไปน (Zimmermann et al., 2004)
1) ก าหนดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน r1 ของแฟมขอมล และก าหนดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน r2 ของแฟมขอมลเดยวกน
2) เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 3) เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 4) ทกๆ เอนทตทอยในเซต E1 E2 อาจจะเปนเอนทตทมการเปลยนแปลงภายใน การ
ตดสนวาเอนทตใดบางทมการเปลยนแปลงแกไขสามารถท าไดโดยการประยกตใชฟงกชนดฟฟ (diff) กบซอรสโคดของเอนทตนนๆของทง 2 เวอรชน
ภายในแพลตฟอรม (Platform) ของอคลพซ (Eclipse) นนมการจดเตรยมโครงราง (Framework) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆทมประสทธภาพสงและสามารถน าไปประยกตเพมเตมไดทงหมด 2 โครงรางไดแกโครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) และโครงรางสตรคเชอรเมรจววเวอร (Structure Merge Viewer) ซงไดกลาวไปแลวในบทท 2 วธการเปรยบเทยบซอรสโคดของเอนทตเดยวกนใน 2 เวอรชนของงานวจยชนนผวจยเลอกใชโครงรางเรนจดฟเฟอรเรนเซอร (Zimmermann et al., 2004)
108
ตวอยางของการระบการเปลยนแปลงแกไขในระดบเอนทตตงแตขนตอนการระบเอนทต ของทง 2 เวอรชนของแฟมขอมลจนถงขนตอนวธการเปรยบเทยบความแตกตางของซอรสโคดของเอนทตเดยวกนใน 2 เวอรชน ดงตอไปน
IBuffer.java : 1.15
IBuffer.java : 1.16
Class IBuffer {
private String buffer = ‘’;
public IBuffer(){
...
}
public String getString(){
return buffer;
}
}
1
2
3
.
7
8
9
10
11
12
IBuffer.IBuffer()
line 2-7
IBuffer.getString()
line 8-10
Class IBuffer
line 1-11
Class IBuffer {
private String buffer = ‘’;
public IBuffer(){
...
}
public String getString(){
return buffer+‘.’;
}
public void splite(){
...
}
public void merge(){
...
}
}
1
2
3
.
7
8
9
10
11
.
34
35
.
52
53
IBuffer.IBuffer()
line 2-7
IBuffer.getString()
line 8-10Class IBuffer
line 1-53
IBuffer.getString()
line 11-34
IBuffer.getString()
line 35-52
(a)
(b)
รปท 3-4 แสดงตวอยางการระบเอนทตภายในซอรสโคด 2 เวอรชนของแฟมขอมล IBuffer.java
จากรปท 3-4 (a) แสดงซอรสโคดของแฟมขอมล IBuffer.java ในเวอรชนท 1.15 และรปท
3-4 (b) แสดงซอรสโคดของแฟมขอมล IBuffer.java ในเวอรชนท 1.16 เมอน าซอรสโคดทง 2 เวอรชนขางตนไปผานการวเคราะหไวยากรณ (Parse) โดยตววเคราะหไวยากรณ (Parser) ท าใหไดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน 1.15 ของแฟมขอมล IBuffer.java และไดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน 1.16 ของแฟมขอมลเดยวกน ดงน
E1 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
109
(file, IBuffer.java, …)
}
E2 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, splite(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, Merge(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
(file, IBuffer.java, …)
}
เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 ดงน
E2 - E1 = { (method, splite(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, Merge(), (Class, IBuffer, (file, IBuffer.java, …)))
}
จากเซต E2 - E1 ขางตนท าใหทราบวามการเพมเอนทตประเภทเมธอดชอ splite() และ Merge() เขาสเอนทตประเภทคลาสชอ IBuffer นนคอเกดเซตของการเปลยนแปลงแกไขดงน
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …))
}
เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 ดงน
110
E1 - E2 = { }
จากเซต E1 - E2 ขางตนเปนเซตวางดงนนท าใหเกดเซตของการเปลยนแปลงแกไขทเปนเซตวางเชนกน
เอนทตทอาจจะถกเปลยนแปลงแกไขภายในสามารถหาไดจาก E1 E2 ดงน
E1 E2 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
(file, IBuffer.java, …)
}
การตดสนวาเอนทตใดบางทมการเปลยนแปลงแกไขภายในจรงๆสามารถท าไดโดยการประยกตใชโครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆ ผลของการเปรยบเทยบคอมการเปลยนแปลงภายในเพยงเอนทตเดยวคอเอนทตประเภทเมธอดชอ getString() จาก return buffer; ในเวอรชน 1.15 เปน return buffer+’.’; ในเวอรชน 1.16 นนคอมเซตของการเปลยนแปลงแกไขดงน
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) }
ดงนนเซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.15 ไปเปนเวอรชน 1.16 ของแฟมขอมล IBuffer.java คอ
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))
}
111
ด าเนนการขนตอนทงหมดนซ ากบแฟมขอมล Product.java จากเวอรชน 1.07 ไปเปนเวอรชนท 1.1 แฟมขอมล Sale.java จากเวอรชน 1.26 ไปเปนเวอรชนท 1.27 แฟมขอมล Shop.java จากเวอรชน 1.11 ไปเปนเวอรชนท 1.12 และ แฟมขอมล Customer.java จากเวอรชน 1.0 ไปเปนเวอรชนท 1.01 เมอไดเซตของการเปลยนแปลงแกไขทงหมดมาแลวใหน าการเปลยนแปลงแกไขเหลานนมารวมกนเปนเซตเดยวแลวเรยกเซตนนวาเซตทรานแซคชน 1 ทรานแซคชน เพอความสะดวกผวจยจงสมมตเซตของการเปลยนแปลงแกไขของแฟมขอมลทงหมดทไดหลงจากท าขนตอนขางตนเรยบรอยแลว ดงน
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.07 ไปเปนเวอรชน 1.1 ของแฟมขอมล Product.java คอ
{ alter(method, getPrice(), (Class, Product, (file, Product.java, …))),
alter(method, getDetail(), (Class, Product, (file, Product.java, …))),
del_from(Class, Product, (file, Product.java, …))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.26 ไปเปนเวอรชน 1.27 ของแฟมขอมล Sale.java คอ
{ alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Sale, (file, Sale.java, …)))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.11 ไปเปนเวอรชน 1.12 ของแฟมขอมล Shop.java คอ
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
112
alter(Class, Shop, (file, Shop.java, …)))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.0 ไปเปนเวอรชน 1.01 ของแฟมขอมล Customer.java คอ
{ alter(method, add(), (Class, Customer, (file, Customer.java, …))),
alter(method, getID(), (Class, Customer, (file, Customer.java, …))),
alter(Class, Customer, (file, Customer.java, …)),
del_from(Class, Customer, (file, Customer.java, …)))
}
ส าหรบงานวจยนผวจยสนใจทรานแซคชนของการเปลยนแปลงแกไขเฉพาะในระดบของแฟมขอมล (file) และคลาส (Class) เทานน แตอยางไรกตามขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตนกยงคงจ าเปนส าหรบงานวจยนเนองจากในภาษาซพลสพลส (C++) นนอนญาตใหใน 1 แฟมขอมลสามารถมคลาสไดมากกวา 1 คลาส ดงนนขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตนจะชวยในการระบเอนทตระดบคลาสของกรณดงกลาวได
การก าจดสงแปลกปลอม (Data Cleaning)
ขนตอนการก าจดสงแปลกปลอม (Data Cleaning) เปนขนตอนทเขาไปตรวจสอบขอมลทงหมดเพอคนหาสงแปลกปลอมและก าจดสงแปลกปลอมเหลานนออกไป ลกษณะของขอมลทรานแซคชนทจะถกระบวาเปนสงแปลกปลอมมอย 2 ลกษณะคอ 1) ทรานแซคชนขนาดใหญ (Large Transactions) และ 2) ทรานแซคชนการผสานกง (Merge Transactions) ตามทไดอธบายรายละเอยดไวในบทท 2
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions และตารางชอ Revisions)
113
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (ฐานขอมลเฉพาะตารางชอ Transactions และตารางชอ Revisions ทถกปรบปรงขอมลใหม)
กระบวนการท างาน คอ พจารณาทรานแซคชนทไดมาจากขอมลออกของขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตขางตนวามทรานแซคชนใดมลกษณะเขาขายทจะเปนสงแปลกปลอมทง 2 ลกษณะหรอไม ถาพบทรานแซคชนทเขาขายดงกลาวจะท าการลบทรานแซคชนเหลานนออกไป
จากตวอยางของเซตรายการการเปลยนแปลงแกไขทไดมาจากขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตในขางนนมทรานแซคชนทมลกษณะเปนทรานแซคชนการผสานกงตามเงอนไขทไดกลาวไปในบทท 2 จงท าใหผลลพธหลงจากผานขนตอนการก าจดสงแปลกปลอมเหลอเซตรายการการเปลยนแปลงแกไข 3 เซต ดงน
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))
}
{ alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Sale, (file, Sale.java, …))),
}
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …)))
}
114
เซตของการเปลยนแปลงแกไขเหลานจะถกน ามารวมกนและตดรายการการเปลยนแปลงแกไขทซ าซอนกนออกแลวเรยกเซตนวาทรานแซคชน กลาวคอจากตวอยางทยกมาขางตนนนเมอน ามาผานสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทง 4 ขนตอนแลวท าใหเกดทรานแซคชนขน 1 ทรานแซคชนทมรายการของการเปลยนแปลงแกไข 7 รายการดงน
T = { add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …)))
}
ขอมลทรานแซคชนทงหมดทไดจากสวนนคอขอมลทรานแซคชนของการเปลยนแปลงแกไขทจะน าไปใชในการสรางกฎความสมพนธในสวนท 3 นอกจากนนทรานแซคชนเหลานจะถกน าไปวเคราะหเพอคดเลอกขนมาสรางเปนขอสอบถามส าหรบการทดสอบทง 3 สถานการณในสวนท 2 ดวย
3.6.2 การสรางขอสอบถาม
การสรางขอสอบถาม คอ สวนทน าทรานแซคชนของการเปลยนแปลงแกไขทงหมดทมาจากสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวมาคดเลอก ทรานแซคชนจ านวนหนงทมความหมายทางสถต เรยกวาทรานแซคชนชดทดสอบ (Test set) เพอ
115
น าทรานแซคชนเหลานนมาใชในการทดสอบ หลงจากนนจงน าทรานแซคชน ทคดเลอกไวไปสรางเปนขอสอบถาม (Query) ส าหรบการทดสอบสถานการณ 3 สถานการณ คอ 1) ขอสอบถามส าหรบการทดสอบสถานการณการน าทาง 2) ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกดขอผดพลาด และ 3) ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ตามขอก าหนดทก าหนดไวในหวขอตวแปรควบคม
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ ขอสอบถามส าหรบการทดสอบสถานการณการน าทาง ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกดขอผดพลาด และขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว (ตารางชอ Queries)
กระบวนการท างานของการสรางขอสอบถามส าหรบแตละสถานการณมขอก าหนดในการสรางทแตกตางกนออกไป ขอก าหนดในการสรางขอสอบส าหรบทง 3 สถานการณสามารถแบงออกเปน 2 ขนตอนยอยดงน
1) การเลอกทรานแซคชนชดทดสอบ 2) การสรางขอสอบถามแตละสถานการณ
การเลอกทรานแซคชนชดทดสอบ
ขอมลซอฟตแวรอารไคฟวทน ามาใชในการวจยนคอขอมลซอฟตแวรอารไคฟวจากโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทม Thomas Baumgart และ Michael Edwardes เปนผกอตงโครงการและปจจบนมนกพฒนาในโครงการนทงหมด 10 คน ชองทางการตดตอสอสารระหวางนกพฒนาภายในโครงการคอการใชระบบไออารซ (IRC Channel) ทตองเขาสระบบโดยใชรหสผใช (Username) และรหสผาน (Password) ของนกพฒนาซงตองรองขอและไดรบอนมตในการรองขอเพอเขารวมเปนนกพฒนาของโครงการ นอกจากนนในกลมนกพฒนาทงหมดมเพยง Thomas Baumgart และ Martin Preuss ทเปดเผยขอมลสวนตว ดวยเหตนท าใหผ วจยมขอจ ากดในการสรางขอสอบถาม (Query) ทไดรบการประเมนชดทดสอบจากผ เชยวชาญ (ในกรณน ผ เชยวชาญคอนกพฒนาทอยในโครงการน) ผ วจยจงใชวธการเลอก
116
ทรานแซคชนตวแทนทมความหมายทางสถตมาจ านวนหนงเพอน าทรานแซคชนเหลานนมาสรางเปนขอสอบถามทใชในการวจยครงน
ทรานแซคชนชดทดสอบทผ วจยเลอกมาเปนตวแทนเพอสรางขอสอบถามส าหรบการทดสอบนหรอทเรยกวา ทรานแซคชนชดทดสอบ (Test set) ผ วจยก าหนดใหมทรานแซคชนชดทดสอบทงหมด 60 ทรานแซคชน ซงถอวาเพยงพอส าหรบขอสอบถามในงานวจยทางดานการคนคนขอมล (Information Retrieval) เนองจากขอสอบถามในงานวจยทางดานการคนคนขอมลควรมอยางนอย 30 หนวยทดสอบ (Baeza-Yates and Riberio-Neto, 1999) จากขอจ ากดทกลาวไปขางตนการสรางขอสอบถามจงตองเลอกจากทรานแซคชนในฐานขอมลทมความหมายทางสถต โดยเลอกทรานแซคชนชดดทดสอบ 60 ทรานแซคชนเปนตวแทนของทรานแซคชนทมขนาดสน กลาง ยาวและแบงเปนทรานแซคชนทพบบอยและพบไมบอยดวย ดงนนทรานแซคชนชดทดสอบทจะเลอกมาจะแบงไดเปน 6 กลมคอ 1) ทรานแซคชนขนาดสนและพบบอย 2) ทรานแซคชนขนาดสนและพบไมบอย 3) ทรานแซคชนขนาดกลางและพบบอย 4) ทรานแซคชนขนาดกลางและพบไมบอย 5) ทรานแซคชนขนาดยาวและพบบอย และ 6) ทรานแซคชนขนาดยาวและพบไมบอย ผวจยเลอกก าหนดใหแตละกลมมจ านวนทเทากนคอกลมละ 10 ทรานแซคชน หรอสามารถแสดงไดดงตารางตอไปน
ตารางท 3-2 แสดงจ านวนของทรานแซคชนในแตละกลมทจะเลอกขนมาสรางเปนขอสอบถาม
การปรากฏ \ ขนาด สน กลาง ยาว พบบอย 10 10 10 พบไมบอย 10 10 10
ขนาดของทรานแซคชนนนนบจากจ านวนของการเปลยนแปลงแกไขทงหมดในทรานแซคชน สวนวธการนบจ านวนการปรากฎของรปแบบทรานแซคชนจะนบจากทรานแซคชนทเปนซเปอรเซตของรปแบบทรานแซคชนนนได
รายละเอยดของการเลอกทรานแซคชนชดทดสอบทเฉพาะเจาะจงกบโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) นนอธบายไวในภาคผนวก ก และน าทรานแซคชนทไดมาท าการสรางขอสอบถามของแตละสถานการณดวยวธการสรางขอสอบถามทอธบายในหวขอถดไป
การสรางขอสอบถามแตละสถานการณ
117
ขอสอบถาม (Query) ส าหรบงานวจยน คอ เซตทประกอบไปดวยเซตเหตการณการเปลยนแปลงแกไขและเซตผลลพธทคาดไว โดยจะมขอสอบถามทงหมด 3 แบบส าหรบ 3 สถานการณทแตกตางกนคอสถานการณการน าทาง สถานการณการปองกนขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว และถกเขยนในรปแบบ q = (Q, E) เชนเดยวกบงานวจยของ Zimmermann และคณะในปค.ศ. 2005 (Zimmermann et al., 2005) และงานวจยของ Methanias และคณะในปค.ศ. 2009 (Methanias et al., 2009) ทท าการทดสอบประสทธภาพของการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร ขนตอนของการสรางขอสอบถามในแตละสถานการณอธบายพอมยกตวอยางไดดงตอไปน (Zimmermann et al., 2005; Methanias et al., 2009)
ก าหนดให ขอสอบถาม (Query) q ใดๆ ถกเขยนในรปแบบ q = (Q, E)
โดยท เซต Q คอเซตเหตการณ (Situation) ซงเปนเซตยอยของเซตทรานแซคชน T
เซต E คอเซตผลลพธทคาดไว (Expected Result) ซงเปนเซตยอยของเซตทรานแซคชน T
และเทากบเซต T - Q
เซต T คอทรานแซคชนทประกอบดวยรายการของการเปลยนแปลงแกไขจ านวน |T| รายการ
สถานการณการน าทาง (Navigation)
ขอสอบถามส าหรบสถานการณการน าทาง ก าหนดใหมขอสอบถามทงหมด |T| ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกในเซตเหตการณ Q เพยง 1 รายการคอรายการ e โดยทรายการ e เปนสมาชกของ ทรานแซคชน T และสมาชกในเซตผลลพธทคาดไว E กคอรายการอก |T| - 1 รายการทเหลอทไมใชรายการ e (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนประกอบดวยรายการการเปลยนแปลงแกไขทงหมด 7 รายการท าใหไดขอสอบถามส าหรบทรานแซคชนชดทดสอบทงหมด 7 ขอสอบถาม โดยทในแตละ
118
ขอสอบถามนนมเซตเหตการณ Q ทมสมาชกเพยง 1 รายการคอ e โดยท e เปนสมาชกของทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการน าทางจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qni คอ ขอสอบถามส าหรบการทดสอบสถานการณการน าทางขอสอบถามท i
ในรป qni = (Q, E)
qn1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) } ,
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) ,
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) ,
alter(Class, Shop, (file, Shop.java, …))) }
)
qn2 = ({ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))},
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn3 = ({ alter(method, add(), (Class, Sale, (file, Sale.java, …)))},
เซตเหตการณ
เซตผลลพธทคาดไว
119
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn4 = ({ alter(method, remove(), (Class, Sale, (file, Sale.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn5 = ({ alter(Class, Sale, (file, Sale.java, …))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
120
qn6 = ({ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Shop, (file, Shop.java, …))) } )
qn7 = ({ alter(Class, Shop, (file, Shop.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)) } )
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qn1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 1 Navgation 11 34, 37, 46, 47, 51, 52
สถานการณการปองกนการเกดขอผดพลาด (Error Prevention)
ขอสอบถามส าหรบสถานการณการปองกนการเกดขอผดพลาด ก าหนดใหมขอสอบถามทงหมด |T| ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกใน เซต
121
เหตการณ Q เทากบ |T| - 1 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกในทรานแซคชน T ทกรายการยกเวนรายการ e โดยทรายการ e เปนสมาชกของทรานแซคชน T และสมาชกในเซตผลลพธทคาดไว E ม 1 รายการคอรายการ e นนเอง (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนท าใหไดขอสอบถามทงหมด 7 ขอสอบถาม โดยทในแตละขอสอบถามนนมเซตเหตการณ Q ทมจ านวนสมาชกเทากบ 6 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกในทรานแซคชน T ทกรายการยกเวน e โดยท e เปนสมาชกของทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการน าทางจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qpi คอ ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกด
ขอผดพลาดขอสอบถามท i ในรป qpi = (Q, E)
qp1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) ,
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) ,
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) } ,
{ alter(Class, Shop, (file, Shop.java, …))) }
)
qp2 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
เซตเหตการณ
เซตผลลพธทคาดไว
122
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Shop, (file, Shop.java, …))) },
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …)))} )
qp3 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(Class, Sale, (file, Sale.java, …))} )
qp4 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, remove(), (Class, Sale, (file, Sale.java, …)))} )
qp5 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
123
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, add(), (Class, Sale, (file, Sale.java, …)))} )
qp6 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Shop, (file, Shop.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))} )
qp7 = ({ alter(Class, Shop, (file, Shop.java, …))),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ add_to(Class, IBuffer, (file, IBuffer.java, …))} )
124
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qp1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 35 Prevention 34, 37, 46, 47, 51, 52 11
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
ขอสอบถามส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ก าหนดใหมขอสอบถามทงหมด 1 ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกในเซตเหตการณ Q เทากบ |T| รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกทกรายการในทรานแซคชน T และเซตผลลพธทคาดไว E เปนเซตวาง (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนท าใหไดขอสอบถามทงหมด 1 ขอสอบถาม โดยทในแตละขอสอบถามนนมเซตเหตการณ Q ทมจ านวนสมาชกเทากบ 7 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกทกรายการในทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลวจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qci คอ ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขท
สมบรณแลวขอสอบถามท i
qc1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) ,
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } ,
เซตเหตการณ
เซตผลลพธทคาดไว
125
)
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qp1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 41 Prevention 11, 34, 37, 46, 47, 51, 52 null
ขอสอบถามทงหมดทไดมานนแบงออกเปน 3 ชด ตามสถานการณตางกน 3 สถานการณเพอน าไปใชในการทดสอบของแตละสถานการณในสวนท 4 (หวขอ 3.6.4)
3.6.3 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ คอ ขนตอนทน าทรานแซคชนของการเปลยนแปลงแกไขทงหมดมาท าเหมองขอมลเพอคนหากฎความสมพนธของการเปลยนแปลงแกไข โดยใชขนตอนวธของ Zimmermann และคณะ (Zimmermann et al., 2005) ทอธบายอยางละเอยดไวในบทท 2 หวขอ 2.8.2 มาประยกตใชส าหรบการคนหากฎความสมพนธทง 2 ตวแบบ
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ กฎความสมพนธทไดจากการท าเหมองขอมลทง 2 ตวแบบรวมถงคาสนบสนนคาความเชอมน/คาความเชอมนใหมของกฎความสมพนธนนๆ (ตารางชอ Rules)
กระบวนการท างานของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ นนคอการน าขนตอนวธในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธทชอวา ขนตอนวธอพรโอร (Apriori algorithm) ทถกน าเสนอโดย Agrawal และ Srikant (Agrawal and Srikant, 1994)
เนองจากงานวจยนสนใจศกษาวาการคนหากฎความสมพนธดวยตวแบบท 2 หรอการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหม
126
ของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอ (IDE: integrated development environment) ไดหรอไม ดงนนในขนตอนการระบความนาสนใจของกฎความสมพนธแตละกฎในทง 2 ตวแบบของการคนหากฎความสมพนธจงแตกตางกนดงน
การคนหากฎความสมพนธดวยตวแบบท 1 ก าหนดใหใชการค านวณคาสนบสนนนบ (Support Count) และคาความเชอมน (Confidence) ในการระบความนาสนใจของกฎความสมพนธ ส าหรบการทดสอบนผวจยก าหนดใหคาสนบสนนนบขนต า (Minimum Support Count) เทากบ 3 และคาความเชอมนขนต า (Minimum Confidence) เทากบ 0.1
การคนหากฎความสมพนธดวยตวแบบท 2 ก าหนดใหใชการค านวณคาสนบสนนนบและคาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในการระบความนาสนใจของกฎความสมพนธ ส าหรบการทดสอบนผ วจยก าหนดใหคาสนบสนนนบขนต าเทากบ 3 และคาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ขนต าเทากบ 0.1
ส าหรบตวอยางของการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธทง 2 ตวแบบนน เนองจากผ วจยไมสามารถสมมตทรานแซคชนทงหมดออกมาไดได ผ วจยจงสมมตกฎความสมพนธจากการคนหากฎความสมพนธ ทเปนผลลพธทไดมาจากกระบวนการขางตน เพอประโยชนในการอางองถงในสวนตอไป ดงน
ก าหนดให R คอ เซตของกฎความสมพนธทแตละรายการอยในรปแบบ Q -> {x} s;c
Q คอ เซตเหตการณทประกอบดวยรายการการเปลยนแปลงแกไขตงแต 1 รายการขนไป
x คอ รายการการเปลยนแปลงแกไขใดๆ
s คอ คาสนบสนนนบของกฎความสมพนธ Q -> {x}
c คอ คาความเชอมนของกฎความสมพนธ Q -> {x}
R = { alter(method, add(), ...) -> alter(method, getString(), ...) 6:0.5,
127
alter(method, add(), ...) -> alter(Class, Shop, ...) 5:0.71,
alter(method, getString(), ...) -> alter(method, getString(), ...) 5:0.63,
alter(method, add(), ...) -> alter(method, remove(), ...) 3:0.5,
alter(method, remove(), ...) -> alter(Class, Shop, ...) 2:0.29,
alter(Class, Sale, ...) -> alter(method, remove(), ...) 2:0.5,
alter(method, getDescription(), ...) -> alter(method, getString(), ...)1:0.14
}
ตวอยางระเบยนของตารางชอ Rules ในการบนทกกฎความสมพนธแรกในเซตขางตน
RuleID Model RAntcSet
(Ref:RevisionID) RConqSet
(Ref:RevisionID) Support Confidence
1 1 11 34 6 0.5
3.6.4 การสรางเซตของค าแนะน าส าหรบเหตการณ
การสรางเซตของค าแนะน าส าหรบเหตการณ คอ การน าเซตของกฎความสมพนธ R ส าหรบเหตการณ Q มาสรางเปนเซตของค าแนะน า (Suggestions) น าเสนอใหกบนกพฒนาเมอนกพฒนาไดท าใหเกดเหตการณ Q ใดๆขนมา เซตของค าแนะน าส าหรบเหตการณ Q สามารถนยามใหอยในรปของการยเนยน (Union) ของเซตรายการทตามมาของกฎความสมพนธ R ทมเซตรายการทมากอน ตรงกบเซตเหตการณ Q ได ดงตอไปน (Zimmermann et al., 2005)
⋃ { }
ในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดตงขอสนนษฐานไววา การใหค าแนะน าในการเปลยนแปลงแกไขกบนกพฒนานน ค าแนะน าทจะไดรบความสนใจกคอค าแนะน าทอยใน 10 อนดบแรก ดงนนในการสรางเซตของค าแนะน าจงควรใหความสนใจกฎความสมพนธทอยใน 10 อนดบแรกโดยเรยงจากคาสนบสนนนบและคาความ
128
เชอมนเทานน ดงนนผ วจยจงก าหนดสมการในการสรางเซตของค าแนะน าดงแสดงในสมการตอไปน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
Aq =
ขอมลเขา คอ เซตของกฎความสมพนธ และเซตเหตการณของขอสอบถามชดทดสอบ (ตารางชอ Rules และตารางชอ Queries)
ขอมลออก คอ เซตของค าแนะน าส าหรบเหตการณทน ามาทดสอบ (ตารางชอ Suggestions)
กระบวนการท างานของการสรางเซตของค าแนะน าส าหรบเหตการณ มขนตอนวธดงตอไปน
1) เลอกเหตการณ Q ทตองการน ามาหาค าแนะน า 2) คนหากฎความสมพนธทมเซตรายการทมากอนตรงกบเซตเหตการณ Q มาจากเซต
ของกฎความสมพนธทงหมด 3) น าเซตรายการทตามมาของกฎความสมพนธทไดจากขอท 2 มารวมกน (Union) เปน
เซตใหมใหชอวา เซตของค าแนะน าส าหรบเหตการณ Q โดยทแตละรายการของเซต
129
ค าแนะน าน จะเ รยงล าดบตามคาสนบสนนนบและคาความเ ชอมนของกฎความสมพนธนนๆ
จากเซตของกฎความสมพนธทไดมาจากขนตอนทแลว ตวอยางของการสรางเซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) แสดงไดดงตอไปน
1) เหตการณทเกดขนคอ เหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …)))
2) จากเซตของกฎความสมพนธทไดมาจากขนตอนทแลวมกฎความสมพนธทมเซตรายการทมากอน เปน alter(method, add(), (Class, Sale, (file, Sale.java, …))) อยทงหมด 3 กฎความสมพนธดงน
alter(method, add(), ...) -> alter(method, getString(), ...) 6:0.5
alter(method, add(), ...) -> alter(Class, Shop, ...) 5:0.71
alter(method, add(), ...) -> alter(method, remove(), ...) 3:0.5
3) น าเซตรายการทตามมาของกฎความสมพนธทง 3 กฎความสมพนธขางตนมารวมกนเปนเซตของค าแนะน าเมอเกดเหนการ เหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) ไดดงตอไปน
Aq = { alter(method, getString(), ...),
alter(Class, Shop, ...),
alter(method, remove(), ...)
}
ตวอยางระเบยนของตารางชอ Suggestions ในการบนทกเซตของค าแนะน าขางตน
SuggestionID ForSituation
(Ref:RevisionID) SuggestionSet
(Ref:RevisionID)
1 11 34, 46, 47
130
3.6.5 การประเมนผลการทดสอบ
เมอไดท าการทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวเสรจสนแลว ขนตอนตอไปนกคอการประเมนผลการทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว จดมงหมายหลกของการทดสอบของงานวจยนคอ การเปรยบเทยบคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบท 1 กบตวแบบท 2 ในสถานการณทตางกน 3 สถานการณ ดงนนหลงจากการทดสอบเสรจสนผวจยจงตองน าผลการทดสอบเหลานนมาค านวณหาคาประสทธภาพ ซงงานวจยนจะใชคาเอฟเมสเชอร (F-measure) มาเปนคาแสดงประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด และคาผลสะทอนกลบ (Feedback) มาเปนคาแสดงประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ขอมลเขา คอ เซตของค าแนะน าส าหรบเหตการณของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions)
ขอมลออก คอ คาประสทธภาพของการทดสอบทง 6 การทดสอบ (แฟมขอมลประเภทขอความทบนทกคาประสทธภาพของการทดสอบทงหมดแยกตามการทดสอบ)
หลงจากขนตอนการสรางเซตของค าแนะน าส าหรบเหตการณแลว ผ วจยจะไดเซตของค าแนะน าส าหรบเหตการณใดๆ ทสรางมาจากกฎความสมพนธของทรานแซคชนทงหมด เซตของค าแนะน านนจะถกน าไปเปรยบเทยบกบเซตผลลพธทคาดไวของชดทดสอบ ส าหรบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดจะน ามาค านวณคาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure)
ในป 2005 งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวกบโครงการพฒนาระบบปฏบตการคอมพวเตอรตางๆ (Operating System) และกลาววา จดมงหมายของการทดสอบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรคอคาความถกตองทสง (คาใกลเคยง 1) และคาเรยกคนทสง (คาใกลเคยง 1) นนคอตองการใหระบบสามารถแนะน าค าแนะน าทงหมด (คาเรยกคนเทากบ 1) และแตละค าแนะน านนถกตองหรอตรงกบเซตผลลพธทคาดไวทงหมด (คาความถกตองเทากบ 1) ดงนนงานวจยของ Zimmermann และคณะจงใช
131
คาเฉลยฮารโมนนคของคาความถกตองและคาเรยกคน (Harmonic mean of Precision and Recall) หรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล เปนคาประเมนประสทธภาพของการท าเหมองขอมล (Zimmermann et al., 2005)
ตอมาในป 2009 งานวจยของ Methanias และคณะ (Methanias et al., 2009) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) ใน 3 สถานการณเชนเดยวกน และแนะน าใหใชคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลส าหรบการประเมนประสทธภาพในสถานการณการน าทางและสถานการณการปองกนขอผดพลาด (Methanias et al., 2009)
ดงนนงานวจยนจงใชคาเอฟเมสเชอรท β = 1 หรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลมาใชในการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด คาเอฟเมสเชอร (F-measure) ทถวงน าหนกคาความถกตองแตคาเรยกคนอยางสมดล แสดงดงสมการตอไปน
ก าหนดให F1 คาเอฟเมสเชอร (F-measure) ทถวงน าหนกคาความถกตองแตคาเรยกคนอยางสมดล
Precision คาความถกตอง Recall คาเรยกคน
q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
เสมอ หรอเรยกวา เซตของค าแนะน า
132
|Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขในเซตค าแนะน าทตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
|Aq| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตของค าแนะน า |E| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
,
และ
เนองจากคาเอฟเมสเชอรนนจะอยในชวง 0 ถง 1 คาเอฟเมสเชอรทมคาเปน 0 ในงานวจยนจะหมายถงประสทธภาพของการคนหากฎความสมพนธต าหรอรายการการเปลยนแปลงแกไขทถกดงขนมาไมตรงกบรายการการเปลยนแปลงแกไขใดๆในเซตผลลพธทคาดไวของขอสอบถามเลย และคาเอฟเมสเชอรทมคาเทากบ 1 ในงานวจยนจะหมายถงประสทธภาพของการคนหากฎความสมพนธสงหรอรายการการเปลยนแปลงแกไขทถกดงขนมาตรงกบเซตผลลพธทคาดไวของขอสอบถามทกรายการ
ตวอยางเชน สมมตขอมลสอบถามชดทดสอบส าหรบสถานการณการน าทาง 1 ขอสอบถาม และเซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) ดงน
ก าหนดให qn คอ ขอสอบถามชดทดสอบส าหรบสถานการณการน าทาง ในรป qn = (Q, E)
Aq คอ เซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …)))
qn = ({ alter(method, add(), (Class, Sale, (file, Sale.java, …))) },
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
133
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
Aq = { alter(method, getString(), ...),
alter(Class, Shop, ...),
del_from(Class, Product, …),
alter(method, remove(), ...)
}
จากขอสอบถามชดทดสอบและเซตของค าแนะน าขางตน น ามาค านวณคาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure) ไดดงน
=
= 0.75
=
= 0.5
=
= 0.6
คาเอฟเมสเชอรทค านวณมาไดนนถามคาใกลเคยง 1 มากกหมายความวายงมประสทธภาพมาก
ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว เซตของค าแนะน านนถกน าไปเปรยบเทยบกบเซตผลลพธทคาดไวของชดทดสอบและคาค านวณผลสะทอนกลบ (Feedback) ตามสมการตอไปน
ก าหนดให |Z*| คอ จ านวนขอสอบถามทอยในเซตของขอสอบถามทมเซตของค าแนะน าทไมเปนเซตวาง (|Aq| ≠ 0)
|Z| คอ จ านวนขอสอบถามทงหมด
134
เมอน าคาผลสะทอนกลบมาใชวดในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะสามารถแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง เนองจากคาผลสะทอนกลบมพสยอยระหวาง 0 กบ 1 คาผลสะทอนกลบทมคาเทากบ 0 หมายถงไมมขอสอบถามใดเลยทใหค าแนะน าทเปนผลบวกลวงออกมาในสถานการณนนนคอมประสทธภาพดทสด และคาผลสะทอนกลบทมคาเทากบ 1 หมายถงขอสอบถามทงหมดใหค าแนะน าทเปนผลบวกลวงออกมานนคอมประสทธภาพไมดทสด ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนจะตองเปรยบเทยบคาผลสะทอนกลบและคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพดกวา
ตวอยางเชน สมมตใหมขอสอบถามในชดทดสอบมทงหมด 100 ขอสอบถาม และสมมตใหมขอสอบถามทไดเซตของค าแนะน าไมเปนเซตวางทงหมด 66 ขอสอบถาม จะสามารถค านวณคาค านวณผลสะทอนกลบ (Feedback) ไดดงน
=
= 0.66
การพจารณาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนสามารถท าไดโดยการน าคาเอฟเมสเชอรทค านวณไดมาเปรยบเทยบโดยใชกราฟในรปแบบทเหมาะสม เพองายตอการพจารณาเปรยบเทยบคาเอฟเมสเชอรของการท าเหมองขอมลดวยรปแบบทง 2 ตวแบบ ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนสามารถท าไดโดยการน าคาค านวณผลสะทอนกลบทค านวณไดมาเปรยบเทยบคากนไดโดยตรง
3.6.6 การทดสอบสมมตฐาน
ส าหรบกรณของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนใชคาเอฟเมสเชอรเปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาเอฟเมสเชอรออกมาเทาจ านวนของขอสอบถามชดทดสอบทสรางขนในขนตอนการสรางขอสอบถาม จากนนในขนตอนแรกจะตรวจสอบการแจกแจงของคาประสทธภาพทไดมาวามการแจกแจงปกตหรอไม ดวยการใชสถตทดสอบ Kolmogorov-Smirnov เพอเลอกทางเลอกในการทดสอบสมมตฐานไดวาจะใหการทดสอบสมมตฐานแบบใชพารามเตอร (Parametric Test)
135
หรอแบบไมองกบพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต ตองใชว ธการทดสอบสมมตฐานแบบไมองกบพารามเตอร (Non Parametric Test) ตอไป โดยในทนคอการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
ส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนใชคาผลสะทอนกลบ เปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาผลสะทอนกลบออกมาหนงคาตอหนงการทดสอบ คาผลสะทอนกลบทไดมานนแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพมากกวา นนคอถาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 มากกวาการคนหากฎความสมพนธดวยตวแบบท 2 แลวจงสามารถปฏเสธ H0 ได
136
3.7 เครองมอทใชในงานวจย
ตามทไดกลาวมาในหวขอแนวทางการท าวจยแลววาผวจยไดพฒนาเครองมอทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบใน 3 สถานการณ ผวจยเลอกใชโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) รวมกบสครปท (Srcript) ทผ วจยสรางขนมาเองดวยภาษาพเอชพ (PHP) และระบบจดการฐานขอมลชอพเอชพมายแอดมน (PHPMyAdmin Database Management System) ซงเปนฐานขอมลแบบเปดสามารถน ามาใชงานไดโดยไมเสยคาใชจายและเขากนไดดกบภาษาพเอชพ (PHP) ผวจยออกแบบเครองมอทดสอบตามขนตอนในหวขอ 3.6 และแผนภาพในรป 3-1 ภาพรวมของเครองมอการทดสอบทงหมดแบงออกเปน 5 สวนดงน
137
(CVS log file)
(eROSE)
1
2
3
2
1
1 1
1 2
1 3
2 1
2 2
2 3
1
1
1
2
1
3
2
1
2
2
2
3
1 2
3
1
4
2
3
1
2
34
5
5
6
67
n n
5
1
2
3
1 1
1 2 1 3 2 1 2 2 2 3
1 1
1 2 1 3 2 1 2 2 2 3
8
รปท 3-5 แสดงภาพรวมของเครองมอทใชในการทดสอบทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
การออกแบบฐานขอมลทใชในงานวจยน ออกแบบตามฐานขอมลของโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) เนองจากผวจยใชบางสวนของโปรแกรมประยกต อโรสมาใชในขนตอนแรกของการวจย ฐานขอมลประกอบดวยตารางทงหมด 9 ตาราง คอ ตารางชอ Directories ตารางชอ Files ตารางชอ Revisions ตารางชอ Transactions ตารางชอ Branches ตารางชอ Tags ตารางชอ Queries ตารางชอ Rules และตารางชอ Suggestions ตวอยางระเบยนของแตละตารางแสดงในหวขอ 3.6 ความสมพนธของแตละตารางแสดงดงแผนภาพตอไปน
138
Directories
PK DirectoryID
DirectoryName
Depth
Files
PK FileID
FileName
FK1 DirectoryID
FileExtension
Depth
NumberOfRevision
FK2 BranchNamesRevisions
PK RevisionID
FileID
FK1 TransactionID
CheckinTime
Plus
Minus
State
Branch
Prefix
Transactions
PK TransactionID
Author
Message
MessageMD5
BeginTime
EndTime
IsNoise
Branches
PK BranchNames
FileID
BranchPrefix
OriginRevision
InternalRevision
Queries
PK QueryID
QueryType
QAntcSet
QConqSet
Rules
PK RuleID
Model
RAntcSet
RConqSet
Support
Confidence
Suggestions
PK SuggestionID
ForSituation
SuggestionSet
Tags
PK TagName
FK2 FileID
FK1 RevisionID
FK1
FK2
FK1
FK2FK1
FK2
รปท 3-6 แสดงแผนภาพออาร (ER Diagram) ฐานขอมลของเครองมอทใชในการทดสอบ
รายละเอยดของเครองมอทง 5 เครองมอ แสดงดงตอไปน
สวนของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
ขนตอนแรกของการทดสอบคอการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ของโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ทพฒนาดวยภาษาซพลสพลส (C++) ในสวนนผ วจยเลอกใชสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวซงเปนสวนหนงโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) เนองจากโปรแกรมประยกตอโรสสามารถรบรองการจดเตรยมขอมลเพอการท าเหมองขอมลของโครงการพฒนาซอฟตแวรทพฒนาดวยภาษาซพลสพลส (C++) และยงเปนเครองมอทถกน าไปใชงานวจยทเกยวของกบการวเคราะหขอมลซอฟตแวรอารไคฟวเชน งานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009)
139
ขนตอนวธส าหรบสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวของโปรแกรมประยกตอโรสประกอบดวย 4 ขนตอนคอ 1) การสกดขอมล (Data Extraction) 2) การซอมแซมทรานแซคชน (Restoring Transactions) 3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities) และ 4) การก าจดสงแปลกปลอม (Data Cleaning) อธบายไวอยางละเอยดหวขอท 3.6.1 เ มอไดทรานแซคชนทสมบรณแลวเกบลงฐานขอมลของงานวจยเพอจดเตรยมขอมลไวกอนจะน าขอมลเหลานไปท าการทดสอบในสวนการสรางขอสอบถามส าหรบการทดสอบส าหรบ 3 สถานการณตอไป
ขอมลเขา คอ ขอมลซอฟตแวรอารไคฟวซงประกอบดวย แฟมขอมลซอรสโคดทงโครงการทกเวอรชน และแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File) ตวอยางของขอมลเขาแสดงดงรป 3-2 ภายใตหวขอ 3.6.1
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข ทประกอบดวยตาราง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions ตวอยางของขอมลออกแสดงในหวขอ 3.6.1
สวนของการสรางขอสอบถามส าหรบการทดสอบส าหรบ 3 สถานการณ
สวนท 2 คอสวนของการสรางขอสอบถามส าหรบการทดสอบส าหรบแตละสถานการณทง 3 สถานการณ การท างานของสวนนประกอบดวยสวนยอย 2 สวนคอ 1) สวนการเลอกทรานแซคชนชดทดสอบ และ 2) สวนการสรางขอสอบถามแตละสถานการณ
ในสวนยอยท 1 ผวจยตองวเคราะหสถตเชงพรรณาและสมเลอกทรานแซคชนชดทดสอบโดยใชโปรแกรมตารางค านวณไมโครซอฟตเอกซเซล (Microsoft Excel) ทงหมดไมไดพฒนาเครองมอส าหรบสวนน ขนตอนวธในการวเคราะหและเลอกทรานแซคชนชดทดสอบจากโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ทอธบายไวในหวขอ 3.6.2 และภาคผนวก ก
ในสวนยอยท 2 เปนสวนทผ วจยพฒนาเครองมอขนมาเองและเรยกวาเครองมอนวาเครองมอสรางขอสอบถามส าหรบ 3 สถานการณ โดยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการตรวจสอบแบบเดนผาน (Walkthrough) กบผลลพธทงหมดของเครองมอน นนกคอขอสอบถามส าหรบ 3 สถานการณรายละเอยดแสดงในภาคผนวก ข
140
ขนตอนวธในสวนยอยท 2 การสรางขอสอบถามทอธบายไวอยางละเอยดในหวขอ 3.6.2
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.1
ขอมลออก คอ ขอสอบถามส าหรบสถานการณน าทาง ขอสอบถามส าหรบสถานการณปองกนการเกดขอผดพลาด และขอสอบถามส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว (ตารางชอ Queries) ตวอยางของขอมลออกแสดงในหวขอ 3.6.2
สวนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
สวนท 3 คอสวนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ นนคอ การคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 เครองมอทผ วจยพฒนาขนมาส าหรบสวนนเรยกวาเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 โดยพฒนาเครองมอทง 2 นในลกษณะของสครปทดวยภาษาพเอชพ (PHP)
ขนตอนวธการคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 ใชขนตอนวธทชอวา วธอพรโอร (Apriori algorithm) อธบายในหวขอ 2.8.2 และก าหนดคาองคประกอบตางๆตามทระบไวในหวขอ 3.6.3 เชนเดยวกบงานวจยของ Zimmermann และคณะในป ค.ศ. 2004 และ 2005 (Zimmermann et al., 2004; Zimmermann et al., 2005) และงานวจยของ Michail ในป ค.ศ. 2000 (Michail, 2000) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการสมตรวจผลลพธหรอกฎความสมพนธทไดมาจากเครองมอทง 2 เครองมอรายละเอยดแสดงในภาคผนวก ข
ขอมลเขาของเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 คอ ทรานแซคชนทงหมดในฐานขอมล (เฉพาะเฉพาะตารางชอ Revisions และตารางชอ Transactions ทงหมด) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.2
ขอมลออกของเครองมอคนหากฎความสมพนธดวยตวแบบท 1 คอ กฎความสมพนธดวยตวแบบท 1 รวมถงคาสนบสนนคาความเชอมนของกฎความสมพนธ (ตารางชอ Rules) ขอมลออกของเครองมอคนหากฎความสมพนธดวยตวแบบท 2 คอ กฎความสมพนธดวยตวแบบท 2 รวมถง
141
คาสนบสนนคาความเชอมนของกฎความสมพนธ (ตารางชอ Rules) ตวอยางของขอมลออกแสดงในหวขอ 3.6.3
สวนของการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถาม
สวนท 4 ของการทดสอบคอสวนของการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถามชดทดสอบ ในสวนนผ วจยพฒนาเครองมอขนมาเองและใหชอวาเครองมอสรางค าแนะน าส าหรบเหตการณ ผวจยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP)
ขนตอนวธการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถามอธบายไวในหวขอ 3.6.4 ซงเปนขนตอนวธเดยวกนกบทใชในงานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการสมตรวจผลลพธหรอเซตของค าแนะน าส าหรบเหตการณทไดมาจากการใชเครองมอน รายละเอยดแสดงในภาคผนวก ข
ขอมลเขา คอ เซตเหตการณในขอสอบถาม (ตารางชอ Queries) และกฎความสมพนธดวยตวแบบท 1 และกฎความสมพนธดวยตวแบบท 2 (ตารางชอ Rules) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.2 และหวขอ 3.6.3 ตามล าดบ
ขอมลออก คอ เซตของค าแนะน าของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions) ตวอยางของขอมลออกแสดงในหวขอ 3.6.4
สวนของการประเมนผลการทดสอบ
สวนสดทายของการทดสอบคอสวนของการประเมนผลการทดสอบเปนสวนทน าเซตของค าแนะน าส าหรบเหตการณทไดมาจากการทดสอบทง 6 การทดสอบมาค านวณหาคาประสทธภาพของการท าเหมองขอมล ในสวนนผ วจยพฒนาเครองมอขนมาเองและใหชอวาเครองมอประเมนผลการทดสอบ โดยการทดสอบททดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนจะค านวณคาเอฟเมสเชอร สวนการทดสอบททดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะค านวณคาสะทอนกลบ เชนเดยวกบงานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009) ผวจยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP) ตามขนตอนวธในการประเมนผลการทดสอบแตละ
142
การทดสอบอธบายอยางละเอยดในหวขอ 3.6.5 ผวจยท าการทดสอบความถกตองของเครองมอน โดยการสมตรวจผลลพธหรอคาประสทธภาพของแตละขอสอบถามในแตละการทดสอบทไดมาจากการใชเครองมอน รายละเอยดแสดงในภาคผนวก ข
ขอมลเขา คอ เซตของค าแนะน าส าหรบเหตการณของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions) และขอสอบถามของแตละสถานการณ
ขอมลออก คอ คาประสทธภาพของการทดสอบทง 6 การทดสอบทอยในรปแบบ (format) ของแฟมขอมลตวอกษร (Text file)
ผ วจยจะน าขอมลออกทไดจากเครองมอประเมนผลการทดสอบไปเขาสขนตอนการทดสอบสมมตฐานซงเปนขนตอนสดทายของการวจยน ผวจยตองใชการวเคราะหและเลอกสถตทดสอบทเหมาะสมตามขอก าหนดทอธบายในหวขอ 3.6.6 และน าไปวเคราะหดวยโปรแกรมสถตเอสพเอสเอสตอไป
3.8 ความถกตอง (Validity) และคาความนาเชอถอ (Reliability) ของขอมลทเกบ
การตอบวตถประสงคของขอมลงานวจยใหเชอถอได (Reliability) และถกตอง (Validity) จ าเปนตองควบคมปจจยทเกยวของอนไดแก การเลอกโครงการพฒนาซอฟตแวร การสรางขอสอบถามและการทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
เนองจากงานวจยนมวตถประสงคในการทดลองเพอศกษาผลกระทบจากตวแปรตน คอ การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ กน ซงตวแปรตนนเปนปจจยทตองเปลยนคาไปตามแบบแผนการทดลองเพอดความแตกตางอนเกดขนจากการทดลอง นอกจากนนยงตองสามารถควบคมปจจยในดานตางๆ ใหมความเหมอนกนหรอมความคงทภายใตสภาวะเดยวกน เพอผลการทดลองทสะทอนเปนคาของตวแปรตนของทงกลมควบคมและกลมทดสอบ นนคอ การคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 เทานน โดยในการทดลองมปจจยทตองควบคมดงน
143
1) การเลอกโครงการพฒนาซอฟตแวรทน ามาใชในการทดสอบ ผ วจยก าหนดใหขอมลซอฟตแวรอารไคฟวและขอสอบถามทจะทดสอบนนเปนขอมลทมาจากโครงการพฒนาซอฟตแวรโครงการเดยวกนเพอใหคาประสทธภาพทวดออกมาน นเปนประสทธภาพทเกดมาจากตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทแตกตางกนอยางแทจรง
2) โครงการพฒนาซอฟตแวรทน ามาใชในงานวจยนเปนโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ซงเปนซอฟตแวรทางการบญช ซงเรมตนการเผยแพรโครงการตงแตป ค.ศ. 2000 มทรานแซคชนของการเปลยนแปลงแกไขกวา 28261 ทรานแซคชน ท าใหขอมลซอฟตแวรอารไคฟวของโครงการนสามารถเปนตวแทนของขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทมความหลากหลายได
3) การก าหนดเซตเหตการณและเซตผลลพธทคาดไวของขอสอบถามทงหมดถกก าหนดมาจากขอมลซอฟตแวรอารไคฟวทน ามาทดสอบเอง จงสามารถแนใจไดวาผลลพธทจะไดออกมานนมาจากเหตการณทเคยเกดขนมาแลวจรงๆในอดต ซงท าใหกระบวนการพจารณาผลลพธทระบบแสดงออกมาในขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยนจะสามารถเชอถอความถกตองของผลลพธซงเปนเซตของค าแนะน าส าหรบเหตการณนนๆได
4) การทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนจะใชคาเอฟเมสเชอร (F-measure) ทเปนการค านวณรวมกนระหวางคาความถกตอง (Precision) และคาเรยกคน (Recall) เปนมาตรวดทนยมใชในการทดลองในงานวจยดานการคนคนสารสนเทศ (Baeza-Yates and Riberio-Neto, 1999) โดยจะเปนการวดวาระบบสามารถใหผลลพธของการคนคนออกมาไดถกตองหรอไม
5) เครองมอทใชในการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบเปนเครองมอเดยวกนทงหมด ตางกนเพยงเครองในการคนหากฎความสมพนธทใชตวแบบในการระบความนาสนใจของกฎความสมพนธ (ตวแปรตน) เทานน
6) เครองมอทใชในการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวคอเครองมอทเปนสวนหนงโปรแกรมประยกตอโรส (eROSE) (Zimmermann et
144
al., 2005) ทไดรบการยอมรบและถกน าไปใชงานวจยทเกยวของกบการวเคราะหขอมลซอฟตแวรอารไคฟวเชน งานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009)
7) เครองมอทผ วจยพฒนาขนมาเองไดแก เครองมอสรางขอสอบถามส าหรบ 3 สถานการณ เครองมอคนหากฎความสมพนธดวยตวแบบท 1 และตวแบบท 2 เครองมอสรางค าแนะน าส าหรบเหตการณ และเครองมอประเมนผลการทดสอบ ผวจยไดท าการทดสอบความถกตองของเครองมอทงดวยวธการสมตรวจความถกตองของผลลพธทเปนตวแทนของผลลพธทงหมด
3.9 กรอบการวเคราะหขอมล (Data Analysis Framework)
ส าหรบกรณของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนใชคาเอฟเมสเชอรเปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาเอฟเมสเชอรออกมาเทาจ านวนของขอสอบถามชดทดสอบทสรางขนในขนตอนการสรางขอสอบถาม จากนนในขนตอนแรกจะตรวจสอบการแจกแจงของคาประสทธภาพทไดมาวามการแจกแจงปกตหรอไม ดวยการใชสถตทดสอบ Kolmogorov-Smirnov เพอเลอกทางเลอกในการทดสอบสมมตฐานไดวาจะใหการทดสอบสมมตฐานแบบใชพารามเตอร (Parametric Test) หรอแบบไมองกบพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต ตองใชว ธการทดสอบสมมตฐานแบบไมองกบพารามเตอร (Non Parametric Test) ตอไป โดยในทนคอการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอย
145
กวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
ส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนใชคาผลสะทอนกลบ เปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาผลสะทอนกลบออกมาหนงคาตอหนงการทดสอบ คาผลสะทอนกลบทไดมานนแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพมากกวา นนคอถาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 มากกวาการคนหากฎความสมพนธดวยตวแบบท 2 แลวจงสามารถปฏเสธ H0 ได
146
บทท 4 ผลการวเคราะหขอมล…….
4.1 บทน า
ในบทนจะแสดงผลและวเคราะหเปรยบเทยบทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบ เพอน ามาตอบวตถประสงคของงานวจยทกลาวไปในบทท 3 ซงไดแก 1) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง 2) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด และ 3) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว และในสวนทายของบทนเปนการศกษาและวเคราะหขอมลเพมเตม
4.2 ผลการทดลอง
การทดลองนมวตถประสงคเพอวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของตวแบบ 2 ตวแบบในสถานการณของการพฒนาซอฟตแวรทตางกน 3 สถานการณ โดยใชคาเอฟเมสเชอรเปนคาประเมนประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวในสถานการณการน าทาง และสถานการณการปองกนขอผดพลาด และใชคาผลสะทอนกลบเปนคาประเมนประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ทรานแซคชนชดทดสอบจ านวน 60 ทรานแซคชนทเปนตวแทนของทรานแซคชนการเปลยนแปลงแกไขจากโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทเลอกมาตามขนตอนยอยภายในขนตอนการสรางขอสอบถามหวขอท 3.6.2 และภาคผนวก ก สามารถน ามาสรางเปนขอสอบถามไดทงหมด 962 ขอสอบถาม ประกอบดวย ขอสอบถามส าหรบทดสอบในสถานการณการน าทางทงหมด 451 ขอสอบถาม ขอสอบถามส าหรบทดสอบใน
147
สถานการณการปองกนการเกดขอผดพลาดทงหมด 451 ขอสอบถาม และขอสอบถามส าหรบทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทงหมด 60 ขอสอบถาม คาเอฟเมสเชอรทไดจากการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบสถานการณการน าทางทงหมด 451 คาและส าหรบสถานการณการปองกนการเกดขอผดพลาดทงหมด 451 คาแสดงในตารางท ข-1 และตารางท ข-2 ตามล าดบ คาผลสะทอนกลบทไดจากการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลวทงหมด 60 คาแสดงในตารางท ข-3
จากการทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบคอ การคนหากฎความสมพนธดวยตวแบบท 1 และ การคนหากฎความสมพนธดวยตวแบบท 2 นน ในสถานการณของการพฒนาซอฟตแวรทตางกน 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว สามารถสรปไดดงน
การทดสอบสถานการณการน าทาง - ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎ
ความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 192 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 เทากบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 111 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 นอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 148 ขอสอบถาม
การทดสอบสถานการณการปองกนการเกดขอผดพลาด - ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎ
ความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 46 ขอสอบถาม
148
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 เทากบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 279 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 นอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 126 ขอสอบถาม
การทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว - ขอสอบถามทไดเซตของค าแนะน าเปนเซตวาง มจ านวน 19 ขอสอบถาม - ขอสอบถามทไดเซตของค าแนะน าไมเปนเซตวาง มจ านวน 41 ขอสอบถาม
จากผลการทดสอบคาเอฟเมสเชอรของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ในตารางท ข-1 และ ข-2 ตามล าดบ ผวจยสามารถแสดงกราฟเพอเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบโดยใชกราฟแทง (Column Chart) ทแสดงผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดดงรปท 4.1 และ 4.2 ตามล าดบ และตารางท 4-1 แสดงตารางสรปผลการทดสอบของทง 3 สถานการณ
รปท 4-1 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
-0.4000
-0.3000
-0.2000
-0.1000
0.0000
0.1000
0.2000
0.3000
0.4000
0.5000
0.6000
1
17
33
49
65
81
97
11
3
12
9
14
5
16
1
17
7
19
3
20
9
22
5
24
1
25
7
27
3
28
9
30
5
32
1
33
7
35
3
36
9
38
5
40
1
41
7
43
3
44
9
ขอสอบถาม
ผลตางของคาเอฟเมสเชอร
149
รปท 4-2 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
ตารางท 4-1 แสดงตารางผลการทดสอบทง 3 สถานการณ
สถานการณการน าทาง (คาเฉลยของคาเอฟเมสเชอร)
สถานการณการปองกนการเกดขอผดพลาด
(คาเฉลยของคาเอฟเมสเชอร)
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (คาผลสะทอนกลบ)
ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 0.3013 0.3245 0.1353 0.1135
จากตารางสรปขางตนแสดงใหเหนวาคาประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนมคาแตกตางกน คาประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนไมมความแตกตางกน แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธในสถานการณตางๆนนแตกตางกนอยางมนยส าคญ ผวจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดในหวขอตอไป
4.3 ผลการวเคราะหขอมล
ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด การตรวจสอบเงอนไขพนฐานขนแรก ผ วจยตองตรวจสอบการแจกแจงของประชากรวาการแจกแจง
-0.5000
-0.4000
-0.3000
-0.2000
-0.1000
0.0000
0.1000
0.2000
0.3000
0.4000
1
17
33
49
65
81
97
11
3
12
9
14
5
16
1
17
7
19
3
20
9
22
5
24
1
25
7
27
3
28
9
30
5
32
1
33
7
35
3
36
9
38
5
40
1
41
7
43
3
44
9
ผลตางของคาเอฟเมสเชอร
ขอสอบถาม
150
ปกตหรอไม เพอเลอกทางเลอกในการทดสอบสมมตฐานวาจะใชวธการทดสอบสมมตฐานแบบองพารามเตอร (Parametric Test) หรอแบบไมองพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต จงใชการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
4.3.1 การวเคราะหการแจกแจงขอมล
ในงานวจยนผวจยสนใจตวแปร คอประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของตวแบบ 2 ตวแบบ ดงนนจงตรวจสอบการแจกแจงของขอมลทไดจากหนวยทดลอง นนคอคาประสทธภาพของการคนหากฎความสมพนธ ซงไดแกคาเอฟเมสเชอรทไดมาจากผลการทดสอบ 451 ขอสอบถาม ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาเอฟเมสเชอรทงหมด 451 คาของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาประสทธภาพแตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 สถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 สถานการณการน าทาง
151
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ผวจยเลอกใชสถตทดสอบ Kolmogorov-Sminov เนองจากมขนาดตวอยางมากกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ดงตารางตอไปน
152
ตารางท 4-2 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาประสทธภาพของการคนกฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ ตวแบบท Kolmogorov-Smirnov
Statistic df Sig.
สถานการณการน าทาง 1 0.070 451 0.000 2 0.075 451 0.000
สถานการณการปองกนการเกดขอผดพลาด
1 0.313 451 0.000 2 0.326 451 0.000
ผลการทดสอบในตารางท 4-2 ขางตนพบวาคา Sig. ของตวแปรคาประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0. 000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบส าหรบ 2 สถานการณนนไมเปนแบบปกต
153
4.3.2 การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมแจกแจงแบบปกต ดงนนผวจยจงเลอกใชสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) และผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) กบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบประสทธภาพระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณ 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด สถานการณการเปลยนแปลงแกไขทสมบรณแลว ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
154
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
H0 : ≤
H1 : >
การทดสอบสมมตฐานขอ 1 และ 2 ดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) แสดงดงตารางท 4-3 ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว การทดสอบสมมตฐานขอ 3 ดวยสถตทดสอบ Z (Two Proportion Z Tests) แสดงดงตารางท 4-4
155
ตารางท 4-3 แสดงคาสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 - คาประสทธภาพของการคนหากฎความสมพนธตวแบบท1
สถานการณการน าทาง สถานการณการปองกนการ
เกดขอผดพลาด Z -4.374a -6.055b Asymp. Sig. (2 tailed) .000 .000 a. Based on negative ranks. b. Based on positive ranks.
จากตารางท 4-3 การวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -4.374 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05 และส าหรบการวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -6.055 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
156
ตารางท 4-4 แสดงการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z ของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
Value df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square .000a 1 1.000
Continuity Correctionb .000 1 1.000
Likelihood Ratio .000 1 1.000
Fisher's Exact Test 1.000 .578
N of Valid Cases 120
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 19.00.
จากตารางท 4.4 คาสถต Z เทากบรากทสองของคา Pearson Chi-Square นนคา 0.000
และมเครองหมายเดยวกบผลตางของอตราสวนท 2 กบอตราสวนท 1 (
–
= 0.000) นนคา
เครองหมายบวก และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 1.000 / 2 = 0.500 ซงมากกวาคา α = 0.05 ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทระดบนยส าคญ 0.05
4.3.3 สรปผลการวเคราะหขอมล
จากการวเคราะหผลการทดสอบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยใชคาเอฟเมสเชอร และสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยใชคาผลสะทอนกลบ ผ วจยสามารถสรปไดวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพมากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว
157
การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกบการคนหากฎความสมพนธดวยตวแบบท 1
จากผลสรปดงกลาวแสดงใหเหนวา การใชตวแบบคาสนบสนน-คาความเชอมนใหมในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวแสดงประสทธภาพทดกวาการใชตวแบบคาสนบสนน-คาความเชอมนเพยงแคในสถานการณการน าทางเทานน
4.4 ผลการศกษาเพมเตม
จากผลทดสอบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหมขางตน ผวจยมความตองการทดสอบเพมเตมเพออธบายสาเหตทการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมแสดงประสทธภาพทดกวาเฉพาะในสถานการณของการน าทาง แตใหประสทธภาพทไมตางกนหรอนอยกวาในสถานการณการปองกนการเกดขอผดพลาดและสถานการณการเปลยนแปลงแกไขทสมบรณแลว จากการด าเนนการทดสอบขางตนผ วจยมขอสงเกตหลายประการ เชน การคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนนมกจะใหเซตของค าแนะน าทใหญกวาการคนหากฎความสมพนธดวยตวแบบสนบสนน-คาความเชอมน เนองจากกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนนมกจะเปนกฎความสมพนธทมเซตรายการทตามมาขนาด 1 รายการเทานน ในขณะทกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมมกจะเปนกฎความสมพนธทมเซตรายการทตามมาขนาดมากกวา 1 รายการ เปนตน จากขอสงเกตดงกลาวผ วจยคดวาเซตของค าแนะน าทมขนาดใหญอาจเปนสาเหตทท าใหคาความถกตอง (Precision) ของการใชตวแบบคาสนบสนน-คาความเชอมนใหมมคานอยและสงผลใหคาเอฟเมเชอรมคานอยตามมาดวย
เ นองจากขนตอนว ธในการทดสอบของงานวจยม ขอแตกตางจากขนตอนว ธ ท Zimmermann และคณะกบ Methanias และคณะ (Zimmermann et al., 2005; Methanias et
158
al., 2009) ใชอยขนตอนหนง คอนกวจยทง 2 คณะนนมการปรบปรงขนตอนวธอพรโอร 2 ประการเพอใหสามารถคนหากฎความสมพนธทรวดเรวขนตามทอธบายไวในบทท 2 คอ 1) การก าหนดใหคนหากฎความสมพนธเฉพาะกฎทมเซตรายการทมากอนทตองการเทานน และ 2) การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยง 1 รายการเทานน จากขอก าหนดขอท 2 นนท าใหเซตของค าแนะน าทจะไดมานนจะมขนาดนอยกวาหรอเทากบ 10 รายการเสมอ แตในงานวจยนผ วจยไมไดปรบปรงขนตอนวธอพรโอรดวยขอก าหนดดงกลาว ขนาดของเซตของค าแนะน าจงมความหลากหลายแตกตางกนออกไป โดยทเซตของค าแนะน าทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนนจะมขนาดนอยกวาหรอเทากบ 10 รายการเสมอเนองจากกฎความสมพนธ 10 อนดบแรกมกจะมเซตรายการทตามมาขนาด 1 รายการหรอเซตรายการทตามมาขนาดมากกวา 1 รายการแตมสมาชกทซ ากบเซตรายการทตามมาของกฎความสมพนธทอยอนดบทสงกวา แตส าหรบเซตของค าแนะน าทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนนมกมขนาดมากกวา 10 เสมอเนองจากเนองจากกฎความสมพนธ 10 อนดบแรกมกจะมเซตรายการทตามมาขนาดมากกวา 1 รายการและสมาชกของเซตรายการทตามมาของแตละกฎความสมพนธใน 10 อนดบแรกมกจะไมซ ากนดวย
ดวยเหตนผ วจยจงมความตองการทจะทดสอบเพมเตมเพออธบายสาเหตของผลการทดสอบขางตน โดยทการทดสอบเพมเตมนผ วจยท าการปรบปรงขนตอนวธในการสรางเซตของค าแนะน าใหม จากคณลกษณะของกฎความสมพนธทอยใน 10 อนดบของการคนหากฎความสมพนธดวยตวแบบทง 2 นน ผ วจยเหนวาไมสามารถน าเซตรายการทตามมาของกฎความสมพนธทง 10 อนดบแรกมาสรางเปนเซตของค าแนะน าไดโดยตรง และผ วจยกเหนวาไมสามารถก าหนดใหพจารณาเฉพาะกฎความสมพนธทคนหามเซตรายการทตามมา 1 รายการเทานนเชนเดยวกบ Zimmermann และคณะกบ Methanias และคณะ (Zimmermann et al., 2005; Methanias et al., 2009) ดวย ผ วจยเหนวาการสรางเซตของค าแนะน าทไดมาจากการคนหากฎความสมพนธทง 2 ตวแบบเพอวตถประสงคในการทดสอบเปรยบเทยบควรจะตองสรางเซตของค าแนะน ามาจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ตวอยางเชน ตารางดานลางนเปนตารางแสดงกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมเรยงล าดบตามคาความเชอมนใหมของกฎความสมพนธทมเซตรายการทมากอนคอ {15}
159
ตารางท 4-5 แสดงตวอยางการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก
กฎความสมพนธ คาสนบสนน คาความเชอมนใหม 1 15 -> 29, 189 25 0.52 2 15 -> 365, 520, 521 16 0.51 3 15 -> 798 42 0.48 4 15 -> 646, 798, 799 16 0.46 5 15 -> 179, 465, 466 15 0.45 6 15 -> 646, 798, 804 15 0.45 7 15 -> 29, 678 22 0.43 8 15 -> 798, 799 22 0.43 9 15 -> 189 39 0.43 10 15 -> 225 56 0.41 เซตของค าแนะน า คอ {29, 179, 189, 365, 465, 520, 521, 646, 798, 799 }
ในตารางขางตนแสดงตวอยางของกฎความสมพนธ คาสนบสนน และคาความเชอมนใหมโดยในหลก (column) ของกฎความสมพนธนนใชตวเลขตางๆ แสดงแทนการเปลยนแปลงแกไขตางๆ เพอความสะดวกในการท าความเขาใจ
ดงนนผ วจยจงมความตองการท าการทดสอบเพมเตม โดยเรมจาก การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ตอดวยการเปรยบเทยบคาประสทธภาพ คาความถกตอง และคาเรยกคน ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ตามล าดบ เพอตอบขอสงเกตทวาคาความ
160
ถกตองของการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมมคานอยกวาแตคาเรยกคนมคามากกวาการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมน
4.4.1 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในการทดสอบขางตนนนเปนการเปรยบประสทธภาพจากการใชคาเอฟเมเชอร (F-measure) เทานน ผวจยจงมความตองการศกษาเพมเตมโดยการทดสอบเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-6 แสดงตารางคาความถกตองและคาเรยกคนของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 Pµ Rµ Pµ Rµ Pµ Rµ Pµ Rµ
0.4750 0.2955 0.4554 0.3530 0.4758 0.5188 0.4620 0.4922
จากตารางสรปขางตนแสดงใหเหนวาคาเฉลยของคาความถกตอง (Precision) หรอ Pµ และคาเฉลยของคาเรยกคน (Recall) หรอ Rµ ของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธของตวแบบทง 2 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
161
การวเคราะหการแจกแจงปกต
เนองจากผวจยตองการเปรยบเทยบคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ทงหมดของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาความถกตอง (Precision) และคาเรยกคน (Recall) แตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
162
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
7) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
163
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-7 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนกฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
Pµ 1 0.088 451 0.000 0.951 451 0.000 2 0.097 451 0.000 0.945 451 0.000
Rµ 1 0.171 451 0.000 0.852 451 0.000 2 0.115 451 0.000 0.901 451 0.000
สถานการณการปองกน การเกดขอผดพลาด
Pµ 1 0.296 451 0.000 0.708 451 0.000 2 0.314 451 0.000 0.699 451 0.000
Rµ 1 0.351 451 0.000 0.636 451 0.000 2 0.345 451 0.000 0.636 451 0.000
ผลการทดสอบในตารางท 4-7 ขางตนพบวาคา Sig. ของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
164
2) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ใน 2 สถานการณนนไมแจกแจงแบบปกต
165
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาความถกตองของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอ ไป น โดย ทจะปฏ เสธสมมตฐาน H0 ไ ด เ ม อ ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตว
166
แบบท 1 ในสถานการณการน าทาง คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตว
แบบท 2 ในสถานการณการน าทาง H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
167
ผวจยใชการทดสอบสมมตฐานโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-8 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาความถกตองและคาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาความถกตองของการคนหากฎความสมพนธตวแบบท 2 -
คาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 -
คาความถกตองของการคนหากฎความสมพนธตวแบบท 1
คาเรยกคนของการคนหากฎความสมพนธตวแบบท 1
สถานการณ การน าทาง
สถานการณการปองกน
การเกดขอผดพลาด
สถานการณ การน าทาง
สถานการณการปองกน
การเกดขอผดพลาด
Z -2.669a -6.054a -9.234b -2.000a Asymp. Sig. (2-tailed)
0.008 0.000 0.000 0.046
a. Based on positive ranks.
b. Based on negative ranks.
จากตารางท 4-8 ไดผลทดสอบดงน
1) การเปรยบเทยบคาความถกตองในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -2.669 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.008 / 2 = 0.004 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
168
2) การเปรยบเทยบคาความถกตองในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -6.054 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
3) การเปรยบเทยบคาเรยกคนในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -9.234 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) การเปรยบเทยบคาเรยกคนในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -2.000 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผ วจยสามารถสรปไดวาในสถานการณการน าทางการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาเรยกคน (Recall) มากกวาแตใหคาความถกตอง (Precision) ทนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ส าหรบสถานการณการปองกนการเกด
169
ขอผดพลาดการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1
4.4.2 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า
การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ผวจยก าหนดใหวธการสรางเซตของค าแนะน าดงกลาวเรยกวา “การสรางเซตของค าแนะน าแบบใหม” ผลการทดสอบดงกลาวแสดงดงตอไปน
ตารางท 4-9 แสดงตารางผลการทดสอบเพมเตมทง 3 สถานการณ
สถานการณการน าทาง (คาเฉลยของคาเอฟเมสเชอร)
สถานการณการปองกนการเกดขอผดพลาด
(คาเฉลยของคาเอฟเมสเชอร)
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (คาผลสะทอนกลบ)
ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 0.3195 0.3335 0.1152 0.1057
จากตารางสรปขางตนแสดงใหเหนวาคาประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนมคาแตกตางกน คาประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนไมมความแตกตางกน แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธในสถานการณตางๆนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
การวเคราะหการแจกแจงขอมล
เนองจากผ วจยตองการเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยการ
170
สรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ดงนนผ วจยจะตรวจสอบวาคาเอฟเมเชอรทงหมดมการแจกแจงแบบปกตหรอไม เฉพาะในส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยตงสมมตฐานของการทดสอบคาเอฟเมเชอรแตละการทดสอบมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
171
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-10 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาประสทธภาพของการคนกฎความสมพนธทง 2 ตวแบบ โดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ ตวแบบท Kolmogorov-Smirnov
Statistic df Sig.
สถานการณการน าทาง 1 0.071 451 0.000 2 0.070 451 0.000
สถานการณการปองกนการเกดขอผดพลาด
1 0.296 451 0.000 2 0.325 451 0.000
ผลการทดสอบในตารางท 4-10 ขางตนพบวาคา Sig. ของตวแปรคาประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
172
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0. 000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบส าหรบ 2 สถานการณนนไมเปนแบบปกต
การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ไมแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) และผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) กบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบประสทธภาพระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการท
173
ตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ในสถานการณ 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด สถานการณการเปลยนแปลงแกไขทสมบรณแลว ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของ
174
ค าแนะน าแบบใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
H0 : ≤
H1 : >
ผวจยทดสอบสมมตฐานขอ 1 และ 2 ดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) แสดงดงตารางท 4-11 ส าหรบสมมตฐานขอ 3 ผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) แสดงดงตารางท 4-12
ตารางท 4-11 แสดงคาสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 - คาประสทธภาพของการคนหากฎความสมพนธตวแบบท1
สถานการณการน าทาง สถานการณการปองกนการ
เกดขอผดพลาด Z -3.159a -3.878b Asymp. Sig. (2 tailed) .000 .000 a. Based on negative ranks. b. Based on positive ranks.
175
จากตารางท 4-11 การวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.159 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05 และส าหรบการวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -3.878 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
ตารางท 4-12 แสดงการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z ของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
Value df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square .000a 1 1.000
Continuity Correctionb .000 1 1.000
Likelihood Ratio .000 1 1.000
Fisher's Exact Test 1.000 .578
N of Valid Cases 120
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 19.00.
176
จากตารางท 4-12 คาสถต Z เทากบรากทสองของคา Pearson Chi-Square นนคา 0.000
และมเครองหมายเดยวกบผลตางของอตราสวนท 2 กบอตราสวนท 1 (
–
= 0.000) นนคา
เครองหมายบวก และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 1.000 / 2 = 0.500 ซงมากกวาคา α = 0.05 ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทระดบนยส าคญ 0.05
สรปผลการวเคราะหขอมล
จากการวเคราะหผลการทดสอบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยใชคาเอฟเมสเชอร และสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยใชคาผลสะทอนกลบ ผวจยสามารถสรปไดวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพมากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลวการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกบการคนหากฎความสมพนธดวยตวแบบท 1
ผลสรปดงกลาวไมไดแสดงใหเหนวา การก าหนดการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกนนสามารถเพมคาความถกตอง (Precision) ใหกบการคนหากฎความสมพนธดวยตวแบบท 2 อยางทผ วจยไดตงขอสงเกตไวหรอไม ดงนนผวจยจงมความตองการศกษาเพมเตมคอ การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธดวยตวแบบทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด เพอทดสอบวาก าหนดการสรางเซตของ
177
ค าแนะน าดงกลาวสามารถเพมคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ในสถานการณทง 2 ไดหรอไม การทดสอบดงกลาวแสดงในหวตอไปน
4.4.3 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกหรอการสรางเซตของค าแนะน าแบบใหมในการทดสอบทแลวนนเปนการเปรยบประสทธภาพจากการใชคาเอฟเมเชอร (F-measure) เทานน ผ วจยจงมความตองการศกษาเพมเตมโดยการทดสอบเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-13 แสดงตารางคาความถกตองและคาเรยกคนของการทดสอบเพมเตมโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 Pµ Rµ Pµ Rµ Pµ Rµ Pµ Rµ
0.4034 0.3856 0.4191 0.3985 0.4621 0.5477 0.4568 0.4945
จากตารางสรปขางตนแสดงใหเหนวาคาเฉลยของคาความถกตอง (Precision) หรอ Pµ และคาเฉลยของคาเรยกคน (Recall) หรอ Rµ ของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธของตว
178
แบบทง 2 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
การวเคราะหการแจกแจงปกต
เนองจากผวจยตองการเปรยบเทยบคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ของการคนหากฎความสมพนธของ 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ทงหมดของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาความถกตอง (Precision) และคาเรยกคน (Recall) แตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต
179
H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
7) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต
180
H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-14 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนกฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
Pµ 1 0.112 451 0.000 0.955 451 0.000
2 0.111 451 0.000 0.949 451 0.000
Rµ 1 0.113 451 0.000 0.906 451 0.000
2 0.09 451 0.000 0.927 451 0.000
สถานการณ การปองกน
การเกดขอผดพลาด
Pµ 1 0.339 451 0.000 0.673 451 0.000
2 0.333 451 0.000 0.683 451 0.000
Rµ 1 0.366 451 0.000 0.633 451 0.000
2 0.344 451 0.000 0.636 451 0.000
181
ผลการทดสอบในตารางท 4-14 ขางตนพบวาคา Sig. ของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
182
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในทง 2 สถานการณนนไมแจกแจงแบบปกต
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาความถกตองของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผวจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
183
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
184
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
ผวจยจงใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ผลการทดสอบแสดงดงตารางตอไปน
185
ตารางท 4-15 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาความถกตองและคาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาความถกตองของการคนหากฎความสมพนธตวแบบท 2 - คาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 -
คาความถกตองของการคนหากฎความสมพนธตวแบบท 1 คาเรยกคนของการคนหากฎความสมพนธตวแบบท 1
สถานการณการน าทาง สถานการณการปองกน การเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกน การเกดขอผดพลาด
Z -3.342a -3.878b -3.290a -4.116b
Asymp. Sig. (2-tailed)
0.001 0.000 0.001 0.000
a. Based on negative ranks.
b. Based on positive ranks.
จากตารางท 4-15 ไดผลทดสอบดงน
1) การเปรยบเทยบคาความถกตองในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.342 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.001 / 2 = 0.0005 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
2) การเปรยบเทยบคาความถกตองในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -3.878 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
186
3) การเปรยบเทยบคาเรยกคนในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.290 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.001 / 2 = 0.0005 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) การเปรยบเทยบคาเรยกคนในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -4.116 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผวจยสามารถสรปไดวาในสถานการณการน าทางการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ส าหรบสถานการณการปองกนการเกดขอผดพลาดการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1
จากผลการทดสอบนและผลการทดสอบในหวขอ 4.4.1 แสดงใหเหนวาการก าหนดการสรางเซตของค าแนะน าแบบใหมหรอการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกนน ท าใหคาความถกตอง (Precision) ของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทางเพมขนไดตามทผ วจยไดตงขอสงเกตไว แตส าหรบใน
187
สถานการณการปองกนการเกดขอผดพลาดนนการก าหนดการสรางเซตของค าแนะน าแบบใหมไมไดท าใหคาความถกตอง (Precision) ของการคนหากฎความสมพนธดวยตวแบบท 2 ดขน ดวยเหตนผ วจยจงตงขอสงเกตตอไปวาสาเหตทท าใหผลการทดสอบออกมาเปนเชนนนเพราะในสถานการณการน าทางกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยมากในขณะทกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงนอยกวา แตในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยในขณะทกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงมากกวา
ดวยเหตนผ วจยจงมความตองการทจะทดสอบเพมเตมตามขอสงเกตขางตนเพออธบายสาเหตของผลการทดสอบหลกของงานวจยน ผ วจยก าหนดการทดสอบเพมเตมโดยการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปน 7 อนดบแรก 5 อนดบแรก และ 3 อนดบแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ตามล าดบ
4.4.4 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า
ผ วจยยงตงขอสงเกตอกวากฎความสมพนธทง 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนน กฎความสมพนธทตรงกบเซตของผลลพธทคาดไวมกจะไมใชกฎความสมพนธทอยในอนดบแรกๆ แตส าหรบการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนน กฎความสมพนธทตรงกบเซตของผลลพธทคาดไวมกจะเปนกฎความสมพนธทอยในอนดบแรกๆ เหตผลทเปนเชนนนผ วจยคดวาอาจเปนไปไดวากฎความสมพนธทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนในอนดบแรกๆมกเปนผลบวกลวง ผ วจยจงสนใจวเคราะหเปรยบเทยบประสทธภาพ
188
ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทดลองปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ คอ 1) สรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก 2) สรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก และ 3) สรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-16 แสดงตารางคาเฉลยของคาเอฟเมสเชอรของการทดสอบการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
คาเฉลยของคาเอฟเมสเชอร
10 อนดบแรก 7 อนดบแรก 5 อนดบแรก 3 อนดบแรก
สถานการณการน าทาง 1 0.3013 0.2820 0.2522 0.2105 2 0.3245 0.3058 0.2936 0.2511
สถานการณการปองกน การเกดขอผดพลาด
1 0.1353 0.1673 0.1857 0.2472 2 0.1135 0.1207 0.1267 0.1316
จากตารางท 4-16 ขางบนสามารถน ามาแสดงในรปแบบขางกราฟเสนเพอใหเหนแนวโนมคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ เมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ไดดงน
189
รปท 4-3 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ใน
สถานการณการน าทาง
รปท 4-4 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ใน
สถานการณการปองกนการเกดขอผดพลาด
จากรปท 4-3 จะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มคามากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในทกๆ การปรบจ านวนของกฎ
0.0000
0.0500
0.1000
0.1500
0.2000
0.2500
0.3000
0.3500
1 2 3 4
ตวแบบท 1 ตวแบบท 2
จ ำนวนอนดบ
คำเอฟเมเชอร
10 7 5 3
0.0000
0.0500
0.1000
0.1500
0.2000
0.2500
0.3000
1 2 3 4 จ ำนวนอนดบ
คำเอฟเมเชอร
ตวแบบท 1 ตวแบบท 2
10 7 5 3
190
ความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง นอกจากนนจะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบมแนวโนมลดลงเรอยๆเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาทนอยลง แสดงใหเหนวาการคนหากฎความสมพนธในสถานการณการน าทางนน กฎความสมพนธทถกตองจรงๆนนมนจะเปนกฎความสมพนธ ทอยในอนดบ ทายๆ และกฎความสมพนธทอยในอนดบตนๆนนเปนผลบวกลวงในทง 2 ตวแบบ
จากรปท 4-4 จะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 มคามากกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในทกๆ การปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ นอกจากนนจะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบมแนวโนมสงขนเรอยๆเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาทนอยลง สาเหตมาจากคาเรยกคนทยงคงทเสมอในขณะทคาความถกตองมคามากขนเรอยๆ (ขนาดเซตของค าแนะน าทลดลงท าใหคาความถกตองสงขน ในขณะทมกฎความสมพนธทถกตองเทาเดมหรอไมลดลงจงท าใหคาเรยกคนเทาเดม) แสดงใหเหนวาการคนหากฎความสมพนธในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธทถกตองจรงๆนนมนจะเปนกฎความสมพนธทอยในอนดบตนๆในทง 2 ตวแบบ
จากตารางและกราฟขางตนแสดงใหเหนวาคาเอฟเมสเชอรหรอคาประสทธภาพของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธของตวแบบทง 2 เมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
191
การวเคราะหการแจกแจงปกต
เนองจากผ วจยตองการเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทดลองปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ดงนนผวจยจะตรวจสอบวาคาเอฟเมเชอรทงหมดมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาเอฟเมเชอรแตละการทดสอบมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต
192
H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
193
7) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
9) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
194
10) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
11) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
12) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
195
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-17 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาเอฟเมเชอรของการคนกฎความสมพนธทง 2 ตวแบบ โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ
จน.กฎความสมพนธ ทน ามาสรางเปนเซตของค าแนะน า
ตว แบบ ท
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
3 1 .127 451 .000 .886 451 .000 2 .130 451 .000 .929 451 .000
5 1 .087 451 .000 .952 451 .000 2 .085 451 .000 .957 451 .000
7 1 .073 451 .000 .960 451 .000 2 .081 451 .000 .960 451 .000
สถานการณ การปองกน ขอผดพลาด
3 1 .372 451 .000 .700 451 .000 2 .409 451 .000 .674 451 .000
5 1 .350 451 .000 .732 451 .000 2 .361 451 .000 .752 451 .000
7 1 .311 451 .000 .798 451 .000 2 .340 451 .000 .779 451 .000
ผลการทดสอบในตารางท 4-17 ขางตนพบวาคา Sig. ของตวแปรคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
196
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
9) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig.
197
เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
10) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
11) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
12) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในทง 2 สถานการณนนไมเปนแบบปกต
198
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอ ไป น โดย ทจะปฏ เสธสมมตฐาน H0 ไ ด เ ม อ ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาเอฟเมเชอรระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
199
2) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน า
200
จากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
5) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
6) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
201
ก าหนดให
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
ผวจยใชการทดสอบสมมตฐานโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-18 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ
คาเอฟเมเชอรของการคนหากฎความสมพนธตวแบบท 2 - คาเอฟเมเชอรของการคนหากฎความสมพนธตวแบบท 1
สถานการณการน าทาง สถานการณการปองกนขอผดพลาด
จน.กฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า 3 5 7 3 5 7
Z -4.795a -5.815a -3.973a -8.766b -8.280b -9.852b
Asymp. Sig. (2-tailed) 0.000 0.000 0.000 0.000 0.000 0.000
a. Based on negative ranks. b. Based on positive ranks. จากตารางท 4-18 ไดผลทดสอบดงน
1) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ไดสถตทดสอบคา Z เทากบ -4.795 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธ
202
สมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
2) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ไดสถตทดสอบคา Z เทากบ -5.815 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
3) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ไดสถตทดสอบคา Z เทากบ -3.973 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ไดสถตทดสอบคา Z เทากบ -8.766 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
5) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ไดสถตทดสอบคา Z เทากบ -8.280 ซงนอยกวา 0 และจากการ
203
ตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
6) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ไดสถตทดสอบคา Z เทากบ -9.852 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ของผลการทดสอบนและผลการทดสอบหลกในหวขอ 4.3 ผวจยสามารถสรปไดวา ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มคาเอฟเมเชอรเฉลยสงกวาการคนหากฎความสมพนธดวยตวแบบท 1 ไมวาจะก าหนดจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเทาใดกตาม โดยการสรางเซตของค าแนะน าจากกฎความสมพนธจ านวนตางๆกนทใหผลตางคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบสงทสดในสถานการณการน าทางคอ การสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก 3 อนดบแรก 10 อนดบแรก และ 7 อนดบแรก ตามล าดบ ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 มคาเอฟเมเชอรเฉลยไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ไมวาจะก าหนดจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเทาไรกตาม โดยการสรางเซตของค าแนะน าจากกฎความสมพนธจ านวนตางๆกนทใหผลตางคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎ
204
ความสมพนธทง 2 ตวแบบมากทสดในสถานการณการปองกนการเกดขอผดพลาดคอ การสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก 5 อนดบแรก 7 อนดบแรก และ 10 อนดบแรก ตามล าดบ
สรปผลการทดลองขางตนสามารถตอบขอสงเกตของผ วจยทตงไวไดคอ ในสถานการณการน าทาง การคนหากฎความสมพนธทง 2 ตวแบบมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆทงค แตกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยมากกวากฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆ แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน การคนหากฎความสมพนธทง 2 ตวแบบมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆในปรมาณทนอยทงค โดยทกฎความสมพนธ ทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยกวากฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวง
ผวจยสงเกตเหนวาในสถานการณการน าทางนน มกจะเกดกฎความสมพนธทเปนผลบวกลวงขนในอนดบตนๆเสมอไมวาใชตวแบบท 1 หรอตวแบบท 2 แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธในอนดบตนๆนนคอนขางถกตองแมนย าและมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยไมวาใชตวแบบท 1 หรอตวแบบท 2 ดวยเหตนผวจยจงสนใจทจะวเคราะหขอสงเกตดงกลาวในหวขอถดไป
4.4.5 การวเคราะหคาประเมนระดบความนาสนใจของกฎความสมพนธในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
จากการทดสอบเพมเตมในหวขอท 4.4.4 ท าใหผวจยทราบวาในสถานการณการน าทางนน มกจะเกดกฎความสมพนธทเปนผลบวกลวงขนในอนดบตนๆเสมอไมวาใชตวแบบท 1 หรอตวแบบท 2 แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธในอนดบตนๆนนคอนขางถกตองแมนย าและมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆนอยไมวาจะใชตวแบบท 1 หรอตวแบบท 2 ผวจยเหนวาสาเหตทเปนเชนนนเพราะการค านวณคาความเชอมนใหมนนแตกตางจากการค านวณคาความเชอมนใหมตรงทคาความเชอมนใหมมการ
205
น าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวย นอกจากนนผวจยเหนวาสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดมลกษณะเฉพาะตวทแตกตางกนทท าใหผลของการน าเอาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเขามาพจารณามผลแตกตางกน ผวจยจงสนใจทจะวเคราะหการค านวณคาประเมนระดบความนาสนใจของกฎความสมพนธทง 2 คา รวมถงการวเคราะหลกษณะเฉพาะของสถานการณทง 2 สถานการณดวย
ตารางท 4-19 แสดงการเปรยบเทยบสตรค านวณและพสยของคาความเชอมนและคาความเชอมนใหม
คาความเชอมน คาความเชอมนใหม
สตรค านวณ Conf(X Y) =
NConf(X Y) =
–
พสย [0,1] [-1,1]
จากตารางขางบนแสดงใหเหนวาความแตกตางของคาความเชอมนกบคาความเชอมนใหมคอการน าเอาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเขามาพจารณาดวย ในสตรค านวณของคาความเชอมนใหมจะเหนวาถาพจนหลงของสตรมคามากจะท าใหคาความเชอมนใหมมคานอย นนคอถาคาความนาจะเปนในการพบเซตรายการทมากอนในทรานแซคชนทไมมเซตรายการทตามมาอยมากคามากแลวกฎความสมพนธนนจะมคาความเชอมนใหมนอย ในขณะทสตรค านวณของคาความเชอมนไมไดน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวย แตกฎความสมพนธทมคาความเชอมนมากอาจจะมคาความนาจะเปนในการพบเซตรายการทมากอนในทรานแซคชนทไมมเซตรายการทตามมาอยทมากกเปนไปได ซงถาเปนเชนนนกฎความสมพนธดงกลาวกคอกฎความสมพนธทถกแนะน าเปนอนดบตนๆแตจรงๆแลวเปนผลบวกลวงนนเอง (Liu et al., 2008)
206
ตารางท 4-20 แสดงการเปรยบเทยบขนาดของเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธขนาด n ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง
สถานการณการปองกน การเกดขอผดพลาด
ขนาดของเซตรายการทมากอน 1 n-1 ขนาดของเซตรายการทตามมา n-1 1
จากตารางขางบนแสดงใหเหนวาความแตกตางของกฎความสมพนธสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดกคอ ในสถานการณการน าทางขนาดของเซตรายการทตามมาจะมขนาดใหญขนเปนเชงเสนเมอขนาดของกฎความสมพนธใหญขนโดยทมขนาดของเซตรายการทมากอนเปน 1 เสมอ ส าหรบสถานการณการปองกนการเกดขอผดพลาดขนาดของเซตรายการทตามมาเปน 1 เสมอโดยทมขนาดของเซตรายการทมากอนจะมขนาดใหญขนเปนเชงเสนเมอขนาดของกฎความสมพนธใหญขน
ในปค.ศ. 2004 Lenca และคณะ (Lenca et al, 2004) กเสนอคณสมบต 5 ขอทคาประเมนความนาสนใจของกฎความสมพนธควรจะม หลงจากนนในป ค.ศ. 2007 Lenca และคณะไดปรบปรงคณสมบตทง 5 ขอนนเลกนอยเพอใหมความยดหยนมากขน (Lenca et al, 2007) คณสมบตทง 5 ขอของ Lenca และคณะนนไดแกคณสมบต Q1 Q2 Q3 Q4 และ Q5 ทอธบายไวในบทท 2 คณสมบต Q1 นนกลาวไววา กฎความสมพนธนนมความนาสนใจสงทสด เมอคาความนาจะเปนในการพบทรานแซคชนทม เซตรายการทมากอนแตไมมเซตรายการทตามมาในฐานขอมลเทากบ 0 และคาประเมนความนาสนใจของกฎความสมพนธควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนตเพอสอความหมายอยางชดเจนวากฎความสมพนธนนนาสนใจสงทสดดวย
จากคณสมบตนจะเหนวาการประเมนวากฎความสมพนธใดมความนาสนใจสงนน ไมสามารถพจารณาเพยงแคคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเทานน แตจะตองพจารณาทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาควบคดวย หรอเพยงพจารณาทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเปนหลก สาเหตท
207
เปนเชนนนกเพราะในบางกรณทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวา หรอกลาวคอในทรานแซคชนทมเซตรายการทมากอนอยมกจะไมมเซตรายการทตามมาเปนสวนใหญ แตในทรานแซคชนทมเซตรายการทตามมาอยมกจะมเซตรายการทมากอนเปนสวนใหญ ตามรปดานลางน
รปท 4-5 แสดงทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการ
ทมากอนแตไมมเซตรายการทตามมามคาสงกวา
กฎความสมพนธทพบวา ทรานแซคชนสวนใหญนนทมเซตรายการทมากอนอยมกจะไมมเซตรายการทตามมา สามารถกลาวไดวาเปนกฎความสมพนธเซตรายการทมากอนกบเซตรายการทตามมามความสมพนธเชงลบตอกน ถากฎความสมพนธนถกจดอนดบวามความนาสนใจในอนดบตนๆ กฎความสมพนธนกคอผลบวกลวงนนเอง (Liu et al., 2008) ดงนนการใชคาประเมนความนาสนใจทขนกบคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเปนหลกเพยงอยางเดยว อยางเชน คาสนบสนน คาความเชอมน คาลฟท เปนตน จงมโอกาสทจะท าใหเกดกฎความสมพนธทเปนผลบวกลวงไดงาย
กรณทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวาดงรปดานบนนน จะมโอกาสเกดขนไดงายเมอพบวาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนมสงมากๆ ในขณะทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทตามมามนอยกวามากๆ เมอพจารณาทรปแบบกฎความสมพนธ
208
ในสถานการณการน าทาง จะเหนวาเซตรายการทมากอนทมขนาดเทากบ 1 เสมอนนมโอกาสสงทคาความนาเปนในการพบทรานแซคชนทมเซตรายการทมากอนมคาสงมากๆ ในขณะทเซตรายการทตามมามขนาดเพมขนเปนเชงเสนตามขนาดของกฎความสมพนธนนมโอกาสสงทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทตามมาจะมนอยมากๆ ดวยเหตนกฎความสมพนธในสถานการณการน าทางทใชคาประเมนความนาสนใจของกฎความสมพนธทขนกบคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเปนหลกเพยงอยางเดยวจงมโอกาสเกดผลบวกลวงไดสง
เมอโอกาสเกดกฎความสมพนธทเปนผลบวกลวงในสถานการณการน าทางมมาก การน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวยของคาความเชอมนใหมจงสามารถลดระดบความนาสนใจของกฎความสมพนธทเปนผลบวกลวงไดมากเชนกน ส าหรบในสถานการณการปองกนการเกดขอผดพลาด คาความนาจะเปนในการไมพบเซตรายการทตามมาทนอยสงผลกฎความสมพนธทมคาความเชอมนหรอคาเชอมนใหมสงมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอย การน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวยของคาความเชอมนใหมจงสามารถชวยลดระดบความนาสนใจของกฎความสมพนธทเปนผลบวกลวงไดนอยดวย
4.4.6 สรปผลการศกษาเพมเตม
การทดสอบการเปรยบเทยบคาประสทธภาพหรอคาเอฟเมเชอร (F-measure) คาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดโดยการสรางเซตของค าแนะน าแบบปกตกบการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ท าใหผวจยทราบวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพเพมขนเมอพจารณาเพยงกฎความสมพนธทอยในอนดบตนๆ ผ วจยจงศกษาเพมเตมโดยการทดสอบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆคอ 7 อนดบแรก 5 อนดบแรกและ 3 อนดบแรก จากการทดสอบนท าใหผ วจยทราบถงแนวโนมการลดลงหรอเพมของประสทธภาพของการคนหากฎความสมพนธของตวแบบทง 2 ทแตกตางกนในสถานการณการน าทางและสถานการณการ
209
ปองกนการเกดขอผดพลาดเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผวจยจงวเคราะหสาเหตของแนวโนมทแตกตางกนใน 2 สถานการณนน
การทดสอบเพมทงหมดนเพอศกษาหาสาเหตของผลการทดสอบหลงของงานวจยนนนคอ การเปรยบเทยบประสทธภาพของการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหม ผลการทดสอบแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหมชวยเพมประสทธภาพใหกบการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวไดเฉพาะในสถานการณการน าทางเทานน และผลการทดสอบเพมแสดงใหเหนวาสาเหตทตวแบบคาสนบสนน-คาความเชอมนใหมชวยเพมประสทธภาพในสถานการณการน าทางเนองมาจากการใชตวแบบคาสนบสนน-คาความเชอมนนนสามารถท าใหเกดกฎความสมพนธทเปนผลบวกลวงไดมาก แตการใชตวแบบคาสนบสนน-คาความเชอมนใหมสามารถลดการเกดผลบวกลวงเหลานนได แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนนการใชตวแบบทง 2 ใหกฎความสมพนธทเปนผลบวกลวงคอนขางนอย และการใชตวแบบคาสนบสนน-คาความเชอมนใหคาความถกตองและคาเรยกคนทดกวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมจงท าใหประสทธภาพของการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนดกวาการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหม
210
บทท 5 สรปผลการวจย………
5.1 บทน า
บทนจะแสดงการสรปผลของงานวจยและปญหาทเกดขนในการวจย สดทายเปนขอเสนอแนะของงานวจย เพอปรบเปลยนรปแบบของงานวจยหรอพฒนาการทดลองใหมประสทธภาพยงขน
5.2 การออกแบบการวจยและลกษณะของขอมลทน ามาใช
งานวจยนเปนการวจยเชงทดลอง (Experimental Research) โดยใชทรานแซคชนของการเปลยนแปลงแกไขและขอสอบถามทสรางมาจากขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) มาทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ซงมทรานแซคชนของการเปลยนแปลงแกไขทงหมด 5458 ทรานแซคชนและเลอกทรานแซคชนชดทดสอบทงหมด 60 ทรานแซคชน (ทรานแซคชนชดทดสอบแสดงอยในภาคผนวก ก) ซงท าใหไดขอสอบถามทใชในการทดสอบทงหมด 962 ขอสอบถาม
การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนเปนการทดสอบประสทธภาพในแงของการประยกตการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร โดยใชวธการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทเสนอโดย Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) ซงแบงการทดสอบประสทธภาพออกเปน 3 สถานการณของการพฒนาซอฟตแวรไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
211
5.3 สรปผลการวจย
งานวจยนมวตถประสงคเพอเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) โดยแบงการทดสอบเปรยบเทยบประสทธภาพของตวแบบทง 2 ตวแบบเปน 3 สถานการณดงน
1) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง
2) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด
3) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ผ วจยใชขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) กบเครองมอทดสอบทผ วจยพฒนาขนมา โดยประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธในงานวจยนใชคา เอฟเมเชอรส าหรบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด และใชคาผลสะทอนกลบส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ผลการทดสอบประสทธภาพและการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 2 ตวแบบใน 3 สถานการณ แสดงไวในภาคผนวก ค สามารถสรปไดดงน
212
5.3.1 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง
การทดสอบในสถานการณการน าทางนใชขอสอบถามทงหมด 451 ขอสอบถาม ผลการทดสอบผ วจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมากกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบความแตกตางคาประสทธภาพของทง 2 กลมดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทดกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดวยตวแบบคาสนบสนน -คาความเชอมนในสถานการณการน าทาง กลาวคอการน าตวแบบคาสนบสนน -คาความเชอมนใหมมาประยกตสามารถเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการน าทางไดอยางมนยส าคญ
ผวจยไดทดสอบเพมเตมเพอเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบ ผลการทดสอบผ วจยพบวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมใหคาความถกตองเฉลย (Average Precision) ทต ากวาและใหคาเรยกคนเฉลย (Average Recall) ทสงกวาการใชตวแบบคาสนบสนน-คาความเชอมนอยางมนยส าคญดวย เนองจากผ วจยสงเกตเหนวาขนาดเซตของค าแนะน าทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหมทมขนาดใหญกวาเซตของค าแนะน าทไดมาจากการใชตวแบบคาสนบสนน -คาความเชอมนเสมอ (คาความถกตองแปรผกผนกบขนาดเซตของค าแนะน า) กฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนทอยในอนดบตนๆจะเปนกฎความสมพนธทมเซตรายการทตามมาเพยง 1 รายการเสมอ (คาความเชอมนของกฎความสมพนธแปรผนตรงกบคาสนบสนนของกฎความสมพนธ และกฎความสมพนธทมเซตรายการทตามมาเพยง 1 รายการมกจะท าใหคาสนบสนนของกฎ
213
ความสมพนธมคามากกวากฎความสมพนธทมเซตรายการทตามมาหลายรายการ) ส าหรบกฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหมทมกจะมเซตรายการทตามมขนาดใหญนน ผ วจยเหนวาอาจเปนเพราะขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) นนแตละแฟมขอมลในโครงการมความสมพนธเชอมโยงกนมาก จงท าใหเกดกฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหม 10 อนดบแรกมความหลากหลาย
นอกจากนนผวจยยงไดทดสอบเพมเตมโดยการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผลการทดสอบซงพบวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพทดกวาการใชตวแบบคาสนบสนน -คาความเชอมนเสมอในสถานการณการน าทาง ไมวาจะปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาใดๆกตาม
5.3.2 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน -คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด
การทดสอบในสถานการณการปองกนการเกดขอผดพลาดนใชขอสอบถามทงหมด 451 ขอสอบถาม ผลการทดสอบผวจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมต ากวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบความแตกตางคาประสทธภาพของทง 2 กลมดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทดอยกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนในสถานการณการปองกนการเกดขอผดพลาด กลาวคอการน าตวแบบคาสนบสนน-คาความเชอมนใหมมาประยกตใชไมสามารถเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎ
214
ความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการปองกนการเกดขอผดพลาดได
ผวจยไดทดสอบเพมเตมเพอเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบ ผลการทดสอบแสดงใหเหนวาการใชตวแบบคาสนบสนน -คาความเชอมนใหมใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ทต ากวาการใชตวแบบคาสนบสนน-คาความเชอมนอยางมนยส าคญดวย โดยสาเหตของผลการทดสอบนเปนเชนเดยวกบทไดกลาวไปในหวขอทแลว
นอกจากนนผ วจยยงไดทดสอบเพมเตมโดยการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผลการทดสอบผ วจยพบวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพทดอยกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนเสมอในสถานการณการปองกนการเกดขอผดพลาด ไมวาจะปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาใดๆกตาม
5.3.3 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนใชขอสอบถามทงหมด 60 ขอสอบถาม ผลการทดสอบผวจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมเทากบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทไมตางกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนในสถานการณการเปลยนแปลงแกไขทสมบรณแลว กลาวคอการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมล
215
ซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการเปลยนแปลงแกไขทสมบรณแลวสามารถน าตวแบบคาสนบสนน-คาความเชอมนหรอตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชไดโดยใหประสทธภาพทไมตางกน
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวขางตนเปนผลทเกดจากการใชขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทเปนโครงการพฒนาซอฟตแวรแบบเปด (Open Source) และมรายละเอยดของโครงการตามทอธบายไวในหวขอท 3.4 จากการทดสอบเพมเตมในหวขอ 4.4.1 ถง 4.4.4 และการวเคราะหเพมเตมในหวขอ 4.4.5 ผวจยสงเกตวาลกษณะของการเปลยนแปลงแกไขทเกดขนของนกพฒนาในโครงการน มลกษณะไมคอยมการแบงกลมแฟมขอมลทแตละคนแกไขอยางชดเจน แสดงใหเหนวานกพฒนาภายในโครงการนอาจไมมการแบงหนาทการท างานของนกพฒนาแตละคน ซงกเปนลกษณะทสามารถเกดขนไดทวไปในโครงการพฒนาซอฟตแวรแบบเปด ลกษณะดงกลาว นอาจแตกตางจากโครงการพฒนาซอฟตแวรเชงพาณชยทมการแบงหนาทการท างานทชดเจน ผวจยจงเหนวาลกษณะทแตกตางกนดงกลาวสามารถสงผลกระทบตอประสทธภาพของระบบใหค าแนะน านกพฒนาไดและเปนประเดนทนาสนใจส าหรบการศกษาในอนาคต
5.4 การน างานวจยไปประยกตใช
ในงานวจยนสามารถใชเปนแนวทางในการศกษาตอไปหรอน าไปประยกตใชในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลประเภทอนๆ โดยผวจยแบงขอเสนอไวดงตอไปน
5.4.1 การน างานวจยไปใชในเชงทฤษฎ
งานวจยในอดตมการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร ใ หผลประสท ธภาพท ด (Zimmermann et al., 2005; Methanias et al., 2009) ดงนนผวจยจงสนใจเพมประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดงกลาว
216
ดวยการน าตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) มาประยกตใช เนองจากตวแบบนมคณสมบตทดกวาตวแบบคาสนบสนน-คาความเชอมนเดมและยงมคณสมบตทนาสนใจคอสามารถลดจ านวนของกฎความสมพนธทเปนผลบวกลวงลงได งานวจยนจงสามารถเปนแนวทางใหกบนกพฒนาทสนใจเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรตอไปได ตวอยางเชน การน าว ธการทดสอบประสทธภาพของงานวจยไปเปนแนวทางในทดสอบเปรยบเทยบประสทธภาพกบตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธตวแบบอนๆตอไป เปนตน
เนองจากงานวจยนมขอจ ากดในการเลอกโครงการพฒนาซอฟตแวรทน ามาทดสอบ จงจ าเปนตองใชโครงการพฒนาซอฟตแวรทเปนแบบเปด (Open source) ผวจยเหนวาโครงการพฒนาซอฟตแวรทเปนแบบเปดอาจมลกษณะหลายๆอยางทแตกตางจากโครงการพฒนาซอฟตแวรเชงพาณชยซงอาจมผลตอประสทธภาพของระบบใหค าแนะน านกพฒนาได งานวจยน จงสามารถเปนแนวทางกบงานวจยทสนใจทดสอบประสทธภาพกบโครงการพฒนาซอฟตแวรเชงพาณชยได รวมถงงานวจยทสนใจเปรยบเทยบความแตกตางของการทดสอบประสทธภาพกบโครงการพฒนาซอฟตแวรทเปนแบบเปดและโครงการพฒนาซอฟตแวรเชงพาณชยดวย
5.4.2 การน างานวจยไปใชในเชงประยกต
จากผลการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบ ในสถานการณการน าทางทใชคาเอฟเมเชอรเปนคาประสทธภาพนนแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหมใหประสทธภาพทดกวา ดงนนถาผ ใชใหความส าคญกบค าแนะน าในสถานการณการน าทางมากทสด ผ ใชสามารถน าตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร ส าหรบในสถานการณการปองกนการเกดขอผดพลาดทใชคาเอฟเมเชอรเปนคาประสทธภาพเชนกนนนแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหประสทธภาพทดกวา ดงนนถาผ ใชใหความส าคญกบค าแนะน าในสถานการณการปองกนการเกดขอผดพลาด ผ ใชควรน าตวแบบคาสนบสนน-คาความเชอมนไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร และส าหรบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทใชคาผลสะทอนกลบเปนคาประสทธภาพนนแสดงใหเหนวาตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพท
217
ไมตางกน ถาผใชใหความส าคญกบค าแนะน าในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ผ ใชสามารถเลอกน าตวแบบคาสนบสนน -คาความเชอมนหรอตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรได
นอกจากนน จากผลการทดสอบเพมเตม แสดงใหเหนวาการใชตวแบบคาสนบสนน-คาความเชอมนใหคาความถกตอง (Precision) ทสงกวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมแตการใชตวแบบคาสนบสนน-คาความเชอมนใหเรยกคน (Recall) ทต ากวาการใชตวแบบคาสนบสนน-คาความเชอมนใหม ถาผ ใชใหความส าคญกบคาความถกตองมากกวาคาเรยกคน ผ ใชควรเลอกน าตวแบบคาสนบสนน-คาความเชอมนไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร แตถาผ ใชใหความส าคญกบคาเรยกคนมากกวาคาความถกตอง ผ ใชควรเลอกน าตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร
เนองจากผลของงานวจยนเปนผลมาจากการทดสอบกบโครงการพฒนาซอฟตแวรแบบเปด (Open source) ดงนนการน างานวจยไปใชในเชงประยกตจงตองใสใจในประเดนของลกษณะของโครงการทน าไปประยกตใชดวย ผ วจยเหนวาผ ใชสามารถน าค าแนะน าในการประยกตใชทกลาวในขางตนไปใชกบโครงการพฒนาซอฟตแวรแบบเปดและโครงการพฒนาซอฟตแวรเชงพาณชยแตอยภายใตเงอนไขของทมพฒนายอยทมขนาดของทมไมมากนกและมความอสระภายในทมสง
5.5 ขอจ ากดของงานวจย
จากการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน มขอจ ากดบางประการดงน
1) ผลการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน เปนผลจากการทดสอบกบขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เทานน ส าหรบการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมล
218
ซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบดวยขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรอนๆ ทมคณลกษณะแตกตางไปจากโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เชน ขนาด อตราการเปลยนแปลงแกไข ภาษาทใชในการพฒนา รวมถงลกษณะของโครงการพฒนาซอฟตแวรแบบเปด (Open Souce) หรอโครงการพฒนาซอฟตแวรเชงพาณชย (Commercial) อาจใหผลทแตกตางกนออกไป
2) การทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน เปนผลจากการทดสอบทผวจยก าหนดคาตางๆ ในเครองมอทใชในการทดสอบดงน
คาสนบสนนนบขนต า (Minimum Support Count) เทากบ 3
คาความ เ ช อมน ข น ต า /คาความ เ ช อมน ใหม ข น ต า (Mimimum Confidence / New Confidence) เทากบ 0.1
การก าหนดคาน าหนกของคาเอฟเมอรแบบสมดล กลาวคอใหน าหนกกบคาความถกตอง (Precision) และคาเรยกคน (Recall) อยางละ 0.5 เทากน
การก าหนดคาตางๆ ในเครองมอทใชในการทดสอบทแตกตางกนออกไปน อาจท าใหไดผลทแตกตางออกไปดงน
การก าหนดคาสนบสนนนบขนต า (Minimum Support Count) มากกวาหรอนอยกวา 3 อาจท าใหเซตของค าแนะน าทไดแตกตางออกไป ซงมผลใหท าใหคาความถกตอง คาเรยกคนและคาเอฟเมเชอรแตกตางออกไปได
การก าหนดคาความเชอมนขนต า/คาความเชอมนใหมขนต า (Mimimum Confidence / New Confidence) ทมากกวา 0.1 อาจท าใหเซตของค าแนะน าทไดแตกตางออกไป ซงมผลใหท าใหคาความถกตอง คาเรยกคนและคาเอฟเมเชอรแตกตางออกไปได
การก าหนดคาน าหนกของคาเอฟเมอรแบบสมดล กลาวคอใหน าหนกกบคาความถกตอง (Precision) และคาเรยกคน (Recall) อยางละ 0.5 เทากน
219
5.6 แนวทางการศกษาตอเนอง
จากขอจ ากดของงานวจย ผ ทสนใจศกษาตอเนองอาจใชเปนแนวทางดงตอไปนในการศกษาได
1) ผ ทสนใจสามารถทดสอบกบขอมลซอฟตแวรและขอสอบถามชดอนทนอกเหนอจากขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เพอใหผลการทดสอบครอบคลมโครงการพฒนาซอฟตแวรทกๆคณลกษณะ
2) ผ ทสนใจสามารถทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวโดยก าหนดคาตางๆของเครองมอทดสอบทเหมาะสม ไดแก คาสนบสนนนบขนต า (Minimum Support Count) คาความเชอมนขนต า / คาความเชอมนใหมขนต า (Mimimum Confidence / New Confidence) และก าหนดคาน าหนกของคาเอฟเมอร
3) ผสนใจการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจย สามารถเปลยนการวดประสทธภาพจากการใชคาเอฟเมเชอรไปเปนการวดคาอนๆแทน เชน การวดประสทธภาพจากนบจ านวนของกฎความสมพนธทเปนผลบวกลวง
4) ผ สนใจสามารถน าตวแบบประเมนระดบความนาสนใจของกฎความสมพนธอนๆมาประยกตใชกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เชน คาลฟท (Lift) คาเลฟเวอเรจ (Leverage) คาคฟเวอเรจ (Coverage) คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) เปนตน
5) ผสนใจการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธดวยตวแบบทง 2 ตวแบบสามารถทดลองกบขอมลซอฟตแวร อารไคฟวของโครงการพฒนาซอฟตแวรเชงพาณชยหรอโครงการพฒนาซอฟตแวรแบบเปดทมกฎระเบยบทเครงครด
6) ผสนใจสามารถประยกตใชตวแบบคาสนบสนน-คาความเชอมนใหมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เ พอวตถประสงคอนๆได เชน การประยกตใชกฎความสมพนธปฏเสธ (Nagative Association Rule) กบการสรางระบบแจงเตอนนกพฒนาวา ไมควรแกไขแฟมขอมลนตอจากแฟมขอมลทแกไขไปกอนหนา เปนตน
220
รายการอางอง
Agrawal, R., Imielinski T., and Swami A. 1993. Mining Association Rules between sets of items in large databases. In Proceedings of the ACM SIGMOD Conference on Management of Data : 207-216.
Agrawal, R., and Srikant, R. 1994. Fast Algorithms for Mining Association Rules. Proc. 20th Very Large Data Bases Conf. (VLDB) : 487-499.
Agrawal, R., and Srikant, R. 1995. Mining Sequential Patterns. In Proc. of the 11th Int'l Conference on Data Engineering.
Agrawal, R., Arning, A., Bollinger, T., Mehta, M., Shafer, J., and Srikant, R. 1996. The quest Data Mining system. In Proceedings of KDD'96 : 244-249.
Ambriola, V., Bendix, L., and Ciancarini, P. 1990. The Evolution of configuration management and version control. Software Engineering Journal. 5, 6: 303-310.
Baeza-Yates, R., and Ribeiro-Neto, B. 1999. Modern Information Retrieval, first ed. Addison-Wesley-Longman.
Ball, T., Kim, J.-M., Porter, A.A., and Siy, H.P. 1997. If Your Version Control System Could Talk. Proc. ICSE Workshop Process Modelling and Empirical Studies of Software Eng.
Baudis, P. 2009. Current Concepts in Version Control Systems.
Beil, F., Ester, M. and Xu, X. 2002. Frequent Term-Based Text Clustering. Proc. Eighth Int’l Conf. Knowledge Discovery and Data Mining (KDD 2002).: 436-442.
Bieman, J.M., Andrews, A.A., and Yang, H.J. 2003. Understanding Change-Proneness In OO Software through Visualization. Proc. 11th Int’l Workshop Program Comprehension. : 44-53.
221
Bird, C., Gourley, A., Devanbu, P.T., Gertz, M., and Swaminathan, A. 2006. Mining email social networks. In Proceedings of Int. Workshop on Mining Software Repositories MSR.
Breu, S., and Zimmermann, T. 2006. Mining Aspects from Version History. Proceedings of the 21st IEEE/ACM International Conference on Automated Software Engineering.: 221-230.
Brin, S., Motwani, R., Ullman J. 1997. Dynamic Itemsets Counting and implication rules for market basket data. In proc. of 997 ACM-SIGMOD Int. Conf. on Management of Data.
Burch, M., Diehl, S., and Weißgerber, P. Visual Data Mining in Software Archives. In Proc. ACM Symposium on Software Visualization SOFTVIS, St. Louis, Missouri, USA, May 2005.
Cederqvist, P. 2006. Version Management with CVS. Network Theory Ltd.
Chadd, W., Jaime, S. 2008. Branching and merging in the repository. Proceedings of the 2008 international working conference on Mining software repositories.
CMMI Product Team. 2006. CMMI for Development, Version 1.2. Software Engineering Institute, Carnegie Mellon University.: CMU/SEI-2006-TR-008.
Conradi, R., Westfechtel B. 1998. Version Models for software configuration management. ACM Computing Surveys (CSUR). 30, 2: 232-282.
Freitas, A. 1999. On rule interestingness measures. Knowledge-Based Systems journal.: 309–315.
Gall, H., Hajek, K., and Jazayeri, M. 1998. Detection of Logical Coupling Based on Product Release History. In Proceedings of the 26th International Conference on Software Maintenance (ICSM ’98). : 190-198.
222
Gall, H., Jazayeri, M., and Krajewski, J. 2003. CVS release history data for detecting logical Couplings. In IWPSE 2003.
Geng. L., Hamilton, HJ. 2006. Interestingness measures for Data Mining - a survey. ACM Comput Surveys 2006. 38(3), article 9
Geyer-Schulz, A., and Hahsler, M. 2002. Evaluation of recommender algorithms for an internet information broker based on simple Association Rules and on the repeat-buying theory. Proceedings of Fourth WebKDD Workshop: Web Mining for Usage Patterns & User Profiles.: 100–114.
Grune, D., Berliner, B. 2006. CVS [On-Line]. Available from: http://www.nongnu.org/cvs/
Hahsler, M. 2009. A Comparison of Commonly Used Interest Measures for Association Rules. Available from: http://www.ai.wu-wien.ac.at/~hahsler/research/association_rules/measures.html
Heravi, M.J. 2009. A study on Interestingness Measures for Associative Classifiers. Master’s Thesis, Department of Computing Science, Faculty of Science, University of Alberta.
Huzefa, K., Michael, C., Jonathan, M. 2007. Comparing Approaches to Mining Source Code for Call-Usage Patterns. Proceedings of the Fourth International Workshop on Mining Software Repositories. :20.
Junqueira, D., Bittar, T., Fortes, R. 2008. A fine-grained and flexible version control for software. SIGDOC’08.
Kim, M., Sazawal, V., Notkin, D., Murphy, G. 2005. An empirical study of code clone genealogies. Proceedings of the 10th European software engineering conference held jointly with 13th ACM SIGSOFT international symposium on Foundations of software engineering.
223
Kotsiantis, S., Kanellopoulos, D. 2006. Association Rules Mining: A Recent Overview. GESTS International Transactions on Computer Science and Engineering. 32, 1: 71-82.
Lenca, P., Meyer, P., Vaillant, B., and Lallich, S. 2004. A multicriteria decision aid for interestingness measure selection. Technical Report LUSSI-TR-2004-01-EN, LUSSI Department, GET/ENST, Bretagne, France.
Lenca, P., Vaillant, B., Meyer P., and Lallich, S. 2007. Association Rule interestingness measures: Experimental and theoretical studies. In Quality Measures in Data Mining.: pages 51–76.
Li, H., Duo, Z., Jian, H., Hua-Jun, Z., Zheng, C. 2007. Finding keyword from online broadcasting content for targeted advertising. Proceedings of the 1st international workshop on Data Mining and audience intelligence for advertising. : 55-62.
Li, Z., and Zhou, Y. 2005. PR-Miner: Automatically Extracting Implicit Programming Rules and Detecting Violations in Large Software Code. In Proceedings of 13th International Symposium on Foundations of Software Engineering (ESEC/FSE'05).
Liguo, Yu. 2007. Understanding component co-Evolution with a study on Linux. Empirical Software Engineering. 12, 2: 123-141.
Liu, J., Xiaoping, F., Zhihua, Q. 2008. A New Interestingness Measure of Association Rules. Genetic and Evolutionary Computing 2008. WGEC '08. Second International Conference. :393-397.
Livshits, B., and Zimmermann, T. 2005. DyanMine: Finding Common Error Patterns by Mining Software Revision Histories. In Proceedings of 13th International Symposium on Foundations of Software Engineering (ESEC/FSE'05).
224
Löh, A., Swierstra, W. Leijen D. 2007. A Principled Approach to Version Control [On-Line]. Available from: http://people.cs.uu.nl/andres/VersionControl.html
Lucian, V., Alex, T., Jarke, W. 2005. CVSscan: visualization of code Evolution. Proceedings of the 2005 ACM symposium on Software visualization.
Lucian, V., Alexandru, T. 2006. An open framework for CVS repository Querying, analysis and visualization. Proceedings of the 2006 international workshop on Mining software repositories.
Major, J.A., and Mangano, J.J. 1995. Selecting among rules induced from a hurricane database. Journal of Intelligent Information systems.: 4:39–52.
Mcgarry, K. 2005. A survey of interestingness measures for knowledge discovery. Knowl. Eng. Review 20, 1, 39–61.
Methanias C.J., Manoel M., Francisco R.. 2009. Mining software change history in an industrial environment. XXIII Brazilian Symposium on Software Engineering.
Michael Fischer, Martin Pinzger, Harald Gall. 2003. Populating a Release History Database from Version Control and Bug Tracking Systems. Proceedings of the International Conference on Software Maintenance. : 23
Michail, A. 1999. Data Mining Library Reuse Patterns in Userselected Applications. In 14th IEEE International Conference on Automated Software Engineering. : 24–33.
Michail, A. 2000. Data Mining Library Reuse Patterns Using Generalized Association Rules. In Proceedings of 22nd International Conference on Software Engineering (ICSE'00). : 167-176.
Miller, W., and Myers, E.W. 1985. A file comparison program. Software Practice and Experience. 15, 11: 1025–1040.
225
Nayyeri, A., and Oroumchian, F. 2006. Fufair: a fuzzy farsi information retrieval system. in proceedings of the 4th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA-06).
Object Technology International. Eclipse Platform Technical Overview, Feb. 2003. Available at www.eclipse.org
Olivier, C., Vincent, D., Tienté, H. Engelbert Mephu Nguifo. 2008. Optimizing Occlusion Appearances In 3D Association Rules Visualization. Intelligent Systems 2008. 2: 15-42-15-49.
O’Sullivan, B. 2009. Making Sense of Revision-control Systems. ACM Queue.
Pei, J., Han, J., Mortazavi-Asl, B., Wang, J., Pinto, H., Chen, Q., Dayal U., and Hsu, M. 2004. Mining Sequential Patterns by Pattern-Growth: The PrefixSpan Approach. IEEE Transaction on Knowledge and Data Engineering. 16: 10.
Piatetsky-Shapiro, G., 1991. Discovery Analysis and Presentation of strong rules. in: Knowledge Discovery in Databases, AAAI/MIT Press. : p. 229-248.
Rijsbergen, C.J. 1979. Information Retrieval. London: Butterworth
Rochkind, M.J. 1975. The Source Code Control System. IEEE Transactions on Software Engineering. SE-1: 4364-370.
Sheikh, L.m., Tanveer, B., Hamdani, M.A. 2004. Interesting measures for Mining Association Rules, 8th International Multitopic Conference.
Sheykh E.K., Abolhassani, H., Neshati M., Behrangi, E., Rostami, A., Mohammadi, M. 2007. Mahak: A Test Collection for Evaluation of Farsi Information Retrieval Systems. IEEE/ACS International Conference on Computer Systems and Applications.
226
Srikant, R. and Agrawal, R. 1995. Mining Sequential Patterns: Generalizations and Per-formance Improvements. Research Report RJ 9994, IBM Almaden Research Center.
Srikant, R., Vu, Q., and Agrawal, R. 1997. Mining Association Rules with Item Constraints. Proc. Third Int’l Conf. KDD and Data Mining (KDD ’97).
Tan, P.n., Kumar, V. 2002. Selecting the Right Interestingness Measure for Association, In Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data.
Tan, P., Kumar, V., and Srivastava, J. 2002. Selecting the right interestingness measure for association patterns. In Proceedings of the 8th International Conference on Knowledge Discovery and Data Mining (KDD 2002). Edmonton, Canada.: 32–41.
Tichy, W. 1985. RCS: A system for version control. Software-Practice and Experience. 15, 7: 637-654.
Tichy, W.F. 1982. Design, implementation, and evaluation of a revision control system. In ICSE '82: Proceedings of the 6th international conference on Software engineering. : 58-67.
Tsunenori I. 2003. Evaluation of Criteria for Information Retrieval. International Conference on Web Intelligence. IEEE Computer Society.
Ubranic´, D.Cˇ., and Murphy, G.C. 2003. Hipikat: Recommending pertinent software development artifacts. In Proc. 25th International Conference on Software Engineering (ICSE). : 408–418.
Williams, C.C., and Hollingsworth, J.K. 2005. Automatic Mining of Source Code Repositories to Improve Bug Finding Techniques. IEEE Trans. Software Eng.: vol. 31, no. 6, pp. 466-480.
227
Williams, C.C., and Hollingsworth J.K. 2005. Recovering System Specific Rules from Software Repositories. In Proceedings of 2nd International Workshop on Mining Software Repositories (MSR'05). : 7-11
Weißgerber, P., Leo, K., Burch, M., Diehl, M. 2005. Exploring Evolutionary Coupling in Eclipse. Proceedings of the 2005 OOPSLA workshop on Eclipse technology eXchange. : 31-34.
Weißgerber, P., and Diehl, S. 2006. Identifying Refactorings from Source-Code Changes. Proceedings of the 21st IEEE International Conference on Automated Software Engineering (ASE'06).: p.231-240.
Weissgerber, P., Mathias, P., Michael, B. 2007. Visual Data Mining in Software Archives to Detect How Developers Work Together. Proceedings of the Fourth International Workshop on Mining Software Repositories, : 9.
Ying, A., Murphy, G., Raymond N., Chu-Carroll, M. 2004. Predicting Source Code Changes by Mining Change History. IEEE Transactions on Software Engineering, 30, 9: 574-586.
Zimmermann, T., Diehl, S., and Zeller Andreas. 2003. How history justifies system architecture (or not). In IWPSE 2003.
Zimmermann, T., Weißgerber, P.. 2004. Preprocessing CVS Data For Fine-Grained Analysis. Proc. Mining Software Repositories. : 2-6.
Zimmermann, T., Weisgerber, P., Diehl, S., Zeller, A. 2005. Mining Version Histories to Guide Software Changes. Proceedings of the 26th International Conference on Software Engineering. : 563-572.
228
ภาคผนวก
229
ภาคผนวก ก การเลอกทรานแซคชนชดทดสอบ…………..
ขนตอนการเลอกทรานแซคชนชดทดสอบน เปนขนตอนยอยขนตอนหนงภายในขนตอนการสรางขอสอบถามทอธบายอยางละเอยดในหวขอ 3.6.2 แตอธบายในภาคผนวกเนองจากเปนการเลอกทรานแซคชนชดทดสอบทเฉพาะเจาะจงกบโครงการเคมายมนน (KMyMoney) เทานน
เรมตนผ วจยตองก าหนดวาทรานแซคชนขนาดสน กลางและยาวนนมขนาดอย ชวงไหนบาง ผ วจยน าขอมลขนาดของทรานแซคชนทงหมดในฐานขอมลมาค านวณหาคาทางสถตเชงพรรณนา รวมถงน าไปสรางเปนแผนภมแทงแจกแจงความถของขนาดทรานแซคชน โดยใชโปรแกรมตารางค านวณไมโครซอฟตเอกซเซล (Microsoft Excel) มขอมลเขาเปนขนาดของแตละทรานแซคชนทงหมด 5,458 ทรานแซคชน ไดขอมลออกเปนตารางคาทางสถตเชงพรรณนาของขนาดทรานแซคชนและแผนภมแทงแจกแจงความถของขนาดทรานแซคชน ดงตารางและรปดานลางน
ตารางท ก-1 แสดงคาทางสถตเชงพรรณนาของขนาดทรานแซคชนในฐานขอมลซอฟตแวรอารไควฟโครงการเคมายมนน (KMyMoney)
คาเฉลยเลขคณตของขนาดทรานแซคชน 3.91 สวนเบยงเบนมาตรฐานของขนาดทรานแซคชน 9.81 พสยของขนาดทรานแซคชน 300 ขนาดของทรานแซคชนต าสด 1 ขนาดของทรานแซคชนสงสด 301 จ านวนทรานแซคชนทงหมด (ทรานแซคชน) 5,458 จ านวนการเปลยนแปลงแกไขทงหมด (รายการ) 21,358
ขอมล ทแสดงอย ในตาราง ขาง ตนน เ ปน ขอมลทางส ถตของ ขอมลซอฟตแว ร อารไควฟโครงการเคมายมนน (KMyMoney) ภายหลงจากผานขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (หวขอ 3.6.1) เรยบรอยแลว
230
รปท ก-1 แสดงแผนภมแทงแจกแจงความถตามขนาดทรานแซคชนในฐานขอมลซอฟตแวร อารไควฟโครงการเคมายมนน (KMyMoney)
เนองจากทรานแซคชนชดทดสอบทจะเลอกขนมาจะตองถกน าไปใชสรางขอสอบถามส าหรบทกสถานการณของการทดสอบ ดงนนทรานแซคชนชดทดสอบทจะเลอกขนมาจะตองเปนไปตามขอก าหนดของการสรางขอสอบถามทง 3 สถานการณนนคอ ตองเปนทรานแซคชนทมขนาดมากกวาหรอเทากบ 2 รายการ จากตารางท ก-1 แสดงคาทางสถตเชงพรรณนาท าใหทราบวาขนาดโดยเฉลยของทรานแซคชนคอ 4 รายการตอ 1 ทรานแซคชน ผ วจยจงเลอกใหทรานแซคชนทมขนาด 2 รายการเพยงขนาดเดยวเปนทรานแซคชนทอยในกลมขนาดสน เนองจากเปนกลมทมขนาดสนกวาคาเฉลยและเปนกลมทมปรมาณเยอะมากจากแผนภมแทง ในรปท ก-1 ขางตน และผ วจยเลอกใหทรานแซคชนทมขนาดมากกวา 12 รายการเปนทรานแซคชนทอยในกลมขนาดยาว เนองจากเปนกลมทมขนาดยาวกวาคาเฉลยและเปนกลมทแยกจากกลมทรานแซคชนทมขนาดอยระหวาง 3 - 11 รายการทผ ใชก าหนดใหเปนกลมขนาดกลางอยางชดเจน (กลมทรานแซคชนทมขนาดอยระหวาง 3 - 11 รายการมแนวโนมลดลงเรอยๆจนถงทรานแซคชนทมขนาด 12 รายการซงเปนจดเปลยนของแนวโนม ดงแสดงในแผนภมแทงในรปท ก-1 ขางตน)
หลงจากทไดชวงขนาดของทรานแซคชนในแตละกลมแลว ตอไปผวจยจะตองก าหนดวาการพบทรานแซคชนรปแบบหนงจ านวนกครงจงจะอยในกลมพบบอย และจ านวนกครงจงจะอยในกลมพบไมบอย โดยผ วจยไดท าการสรางรปแบบทเปนไปไดทงหมดของทรานแซคชนทมขนาดตางๆออกมาแลวท าการนบจ านวนการปรากฎของรปแบบทเปนไปไดเหลานนในฐานขอมลทงหมด
0
500
1000
1500
2000
25001 5 9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
Fre
qu
en
cy
Bin
Histogram
231
เนองจากฐานขอมลซอฟตแวรอารไคฟวทน ามาใชมจ านวนของการเปลยนแปลงแกไขทงหมด 21,358 รายการ (นบมาจากการเปลยนแปลงแกไขทเกดขนจรงทงหมด ดงนนการเปลยนแปลงแกไขทเคยเกดขนมากกวา 1 ครงจะถกนบซ าดวย) ในการเปลยนแปลงแกไขเหลานนมการเปลยนแปลงแกไขทแตกตางกนทงหมด 3,162 รายการ การเปลยนแปลงแกไขทง 3,162 รายการน จะถกน าไปสรางเปนรปแบบทรานแซคชนทเปนไปไดทงหมดในทกขนาดตางๆกน (ตวอยางเชน
การสรางทรานแซคชนขนาด 2 รายการทเปนไปไดทงหมดจะได
= 4,997,541 รปแบบ
ทรานแซคชน เปนตน) แลวนบจ านวนวาแตละรปแบบมจ านวนการพบในฐานขอมลทงหมดกครง รปแบบทรานแซคชนทไมเคยปรากฎเลยในฐานขอมล (รปแบบทรานแซคชนทมจ านวนการพบเทากบ 0 ครง) จะถกตดออก การนบจ านวนการพบหรอการปรากฎของรปแบบทรานแซคชนตางๆในแตละขนาดแสดงดงตารางตอไปน
232
ตารางท ก-2 แสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆและจ านวนการปรากฎตางๆ
จ านวนครงทปรากฏ
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
ขนาดของทรานแซคชน
2 2884 1419 844 486 299 191 162 115 83 52 50 40 24 29 25 19 13 17 12 19 12 11 7 6 9 5 8 7
3 18712 5653 2214 1001 514 291 193 125 99 71 48 41 25 18 19 8 10 7 6 3 4 2 6 5 6 7 2 1
4 65434 11085 2853 1082 447 207 134 87 61 37 18 11 6 6 3 1 0 2 0 0 0 2 2 3 2 2 0 0
5 161263 14374 2238 728 205 91 57 29 11 10 4 2 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
6 381140 18030 1271 322 52 26 13 1 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
7 980881 16243 502 85 5 4 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
8 1332620 4932 131 10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
9 1204311 2002 19 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
10 898238 595 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
11 226510 123 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
12 71633 16 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
13 60521 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
14 30201 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
15 5630 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
16 639 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
17 217 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
18 98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
19 45 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
232
233
ตารางขางตนแสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆตงแตขนาด 2 จนถงขนาด 20 รายการและจ านวนการปรากฎตางๆตงแต 3 ครงจนถง 30 ครงซงเปนเพยงสวนหนงของการสรางและนบจ านวนรปแบบทรานแซคชนทเปนไปได แถวของตารางแสดงขนาดของรปแบบทรานแซคชน หลกของตารางแสดงจ านวนครงทปรากฎ จ านวนทปรากฎภายในตารางคอจ านวนของรปแบบทมขนาดเทากบขนาดของแถวนนและปรากฎในฐานขอมลเทากบจ านวนของหลกนน สาเหตทตารางเรมทจ านวนการปรากฏ 3 ครงเนองจากการปรากฏ 1 ครงเปนการปรากฎขนต าอยแลว สวนการปรากฏ 2 ครงนนมจ านวนมากในหลกหมน แสนและลานผวจยจงไมน ามาแสดง
จากจ านวนทแสดงในตารางขางตนท าใหผ วจยสามารถก าหนดขอบบนใหกบทรานแซคชนชดทดสอบกลมทมขนาดยาวได ขอบบนนนคอขนาด 19 รายการ เนองจากในขนาด 20 รายการนนมการปรากฎมากทสดแคเพยง 2 ครง ถาน ามาแยกตอเปนพบบอยกบพบไมบอยจะไดวาพบไมบอยคอพบ 1 ครงสวนพบบอยคอพบเพยง 2 ครง ซงในความเปนการพบ 1 และ 2 ครงนนแตกตางกนนอยมาก
จากตาราง ท าใหผ วจยตองก าหนดจ านวนทจะเรยกวาพบบอยและพบไมบอยของแตละขนาดแตกตางกนออกไป โดยผ วจยเลอกแบงกงกลางระหวางจ านวนการปรากฎทนอยทสด (ปรากฏ 1 ครงเสมอ) กบจ านวนการปรากฎทมากทสดของแถวนนๆ ตวอยางเชน ทรานแซคชนขนาด 5 รายการมจ านวนการปรากฏทมากทสดคอ 15 ครง ดงนนจดแบงคอ (1+15)/2 = 8 จะไดวาการพบทรานแซคชนขนาด 5 รายการทพบนอยกวา 8 ครงเปนกลมทพบไมบอยและการพบทรานแซคชนขนาด 5 รายการทพบมากกวาหรอเทากบ 8 ครงเปนกลมทพบบอย ดวยวธการนจะท าใหไดกลมพบบอยและกลมพบไมบอยของแตละขนาดดงน
234
ตารางท ก-3 แสดงการแบงกลมจ านานการปรากฎของทรานแซคชนแตละขนาด
ขนาด \ การปรากฎ
จ านวนการปรากฎ (ครง) กลมพบไมบอย กลมพบบอย
2 1-24 25-49 3 1-24 25-48 4 1-14 15-29 5 1-7 8-15 6 1-6 7-13 7 1-4 5-9 8 1-3 4-6 9 1-2 3-5 10 1-2 3-5 11 1-2 3-4 12 1-2 3-4 13 1-2 3-4 14 1 2-3 15 1 2-3 16 1 2-3 17 1 2-3 18 1 2-3 19 1 2-3
เมอไดขอบเขตของแตละกลมในการเลอกทรานแซคชนขนมาสรางเปนขอสอบถามแลว ผวจยใชวธการสมเลอก ทรานแซคชนออกมาตามกลมนนๆจ านวนกลมละ 10 ทรานแซคชนท าใหไดทรานแซคชนทเปนตวแทนของแตละกลม รวมทงสน 60 ทรานแซคชนมาเปนตวแทนของทรานแซคชนทงหมด และเรยกทรานแซคชนทง 60 ทรานแซคชนนวา ทรานแซคชนชดทดสอบ การสมเลอกดงกลาวใชโปรแกรมตารางค านวณไมโครซอฟตเอกซเซล (Microsoft Excel) โดยมขอมลเขาเปนหมายเลขของทรานแซคชน ขนาด จ านานการปรากฎทงหมดและขอก าหนดในตารางขางตน
235
ขอมลออกคอหมายเลขทรานแซคชนทไดรบการสม ทรานแซคชนชดทดสอบทงหมดแสดงไวในตารางตอไปน
ก าหนดให alter(x) คอ การเปลยนแปลงแกไขในมตแกไข (alter) เอนทต x โดยท x เปนเอนทตในระดบของแฟมขอมล แทนการเขยนแบบเตม alter(file, x, …) เพอความสะดวกในการแสดงขอมล
ตารางท ก-4 แสดงทรานแซคชนชดทดสอบ
ทรานแซคชน 1 {alter(ChangeLog), alter(mymoneyaccount.cpp)} 2 {alter(mymoneyfile.h), alter(mymoneyseqaccessmgr.h)} 3 {alter(kmymoneyutils.cpp), alter(kmymoneyutils.h)} 4 {alter(mymoneyfile.cpp), alter(mymoneyseqaccessmgr.cpp)} 5 {alter(kledgerviewcheckings.cpp), alter(kledgerviewloan.cpp)} 6 {alter(ChangeLog), alter(kmymoneyview.cpp)} 7 {alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp)} 8 {alter(kgloballedgerview.cpp), alter(kmymoneyview.cpp)} 9 {alter(kmymoney2.h), alter(kmymoney2ui.rc)} 10 {alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.h)} 11 {alter(knewaccountwizard.cpp), alter(kmymoneyedit.cpp)} 12 {alter(Makefile.am), alter(kreportsview.cpp)} 13 {alter(knewaccountwizard.cpp), alter(kbanklistitem.cpp)} 14 {alter(mymoneyreport.cpp), alter(querytable.cpp)} 15 {alter(kmymoneyview.cpp), alter(kmymoneyregister.cpp)} 16 {alter(keditequityentrydlg.cpp), alter(keditequityentrydlg.h)} 17 {alter(knewaccountdlg.cpp), alter(kledgerview.cpp)} 18 {alter(mymoneyfile.cpp), alter(mymoneystoragedump.cpp)} 19 {alter(kledgerview.cpp), alter(kmymoneyregister.cpp)} 20 {alter(Makefile.am), alter(kmymoneyview.cpp)} 21 {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)}
236
22 {alter(kledgerview.cpp), alter(kledgerview.h), alter(kledgerviewcheckings.cpp)} 23 {alter(ChangeLog), alter(kmymoney2.cpp), alter(mymoneyaccount.cpp),
alter(mymoneyfile.h)} 24 {alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(imymoneyserialize.h),
alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h)} 25 {alter(mymoneyfile.cpp), alter(imymoneyserialize.h), alter(imymoneystorage.h),
alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(mymoneyseqaccessmgrtest.cpp)}
26 {alter(ChangeLog), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kmymoneyview.cpp)}
27 {alter(kmymoney2.cpp), alter(kgloballedgerview.cpp), alter(kmymoneyview.cpp), alter(register.cpp), alter(register.h), alter(transaction.cpp), alter(transaction.h)}
28 {alter(kmymoney2.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(imymoneyserialize.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(mymoneystoragedump.cpp), alter(mymoneystoragexml.cpp), alter(kmymoneyview.cpp)}
29 {alter(kendingbalancedlg.cpp), alter(kexportdlg.cpp), alter(kfindtransactiondlg.cpp), alter(kimportdlg.cpp), alter(knewaccountdlg.cpp), alter(knewbankdlg.cpp), alter(kreconciledlg.cpp), alter(kcategoriesview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
237
30 {alter(kmymoney2.cpp), alter(ieditscheduledialog.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfiletest.cpp), alter(mymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kpayeesview.cpp)}
31 {alter(imymoneystorage.h), alter(mymoneystoragexml.cpp), alter(kmymoneyview.cpp)}
32 {alter(kmymoney2.cpp), alter(mymoneystoragexml.cpp), alter(kmymoneyview.cpp)}
33 {alter(kmymoney2.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h)}
34 {alter(kmymoney2.h), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(kcategoriesview.cpp), alter(kmymoneyview.cpp)}
35 {alter(kmainview.cpp), alter(kmymoneyview.cpp), alter(kmymoneyview.h), alter(knewbankdlg.cpp), alter(mymoneyaccount.h), alter(mymoneyfile.h)}
36 {alter(config.h.in), alter(kmymoney2.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(kbanksview.cpp), alter(kcategoriesview.cpp)}
37 {alter(config.h.in), alter(Makefile.common), alter(acinclude.m4.in), alter(am_edit), alter(conf.change.pl), alter(config.pl), alter(config.sub)}
38 {alter(kmymoney2.cpp), alter(kcurrencycalculator.cpp), alter(kcurrencyeditdlg.cpp), alter(knewaccountdlg.cpp), alter(ksplittransactiondlg.cpp), alter(kmymoneyaccountselector.cpp), alter(kmymoneysplittable.cpp)}
39 {alter(kmymoney2.kdevprj), alter(Makefile.am), alter(mymoneyaccount.h), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneytransaction.cpp), alter(mymoneytransaction.h)}
238
40 {alter(kmymoney2.kdevprj), alter(kmymoney2.cpp), alter(kmymoney2.h), alter(Makefile.am), alter(kbanklistitem.cpp), alter(kbanklistitem.h), alter(kbanksview.cpp), alter(kbanksview.h), alter(kmymoneyview.cpp), alter(kmymoneyview.h)}
41 {alter(kmymoney2.cpp), alter(kcsvprogressdlg.cpp), alter(kendingbalancedlg.cpp), alter(kexportdlg.cpp), alter(kfindtransactiondlg.cpp), alter(kimportdlg.cpp), alter(knewaccountdlg.cpp), alter(knewbankdlg.cpp), alter(kreconciledlg.cpp), alter(kcategoriesview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
42 {alter(kmymoney2.cpp), alter(kcurrencycalculator.cpp), alter(kcurrencyeditdlg.cpp), alter(kendingbalancedlg.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(kcategoriesview.cpp), alter(kmymoneyview.cpp), alter(Makefile.am), alter(kmymoneypriceview.cpp), alter(kmymoneypriceview.h)}
43 {alter(kmymoney2.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp,mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
44 {alter(ieditscheduledialog.cpp), alter(keditloanwizard.cpp), alter(kenterscheduledialog.cpp), alter(knewaccountwizard.cpp), alter(kledgerview.cpp), alter(kledgerviewcheckings.cpp), alter(kledgerviewinvestments.cpp), alter(kledgerviewloan.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp), alter(kmymoneyregistercheckings.cpp), alter(kmymoneyregistersearch.cpp)}
239
45 {alter(ieditscheduledialog.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
46 {alter(kmymoney2.cpp), alter(ieditscheduledialog.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
47 {alter(kmymoney2.cpp), alter(ieditscheduledialog.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
48 {alter(kmymoney2.cpp), alter(ieditscheduledialog.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
49 {alter(ChangeLog), alter(mymoneyqifreader.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneyserialize.h), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(mymoneyseqaccessmgrtest.cpp), alter(mymoneystoragedump.cpp), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
240
50 {alter(ChangeLog), alter(kmymoney2.cpp), alter(mymoneyqifreader.cpp), alter(ieditscheduledialog.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.h), alter(mymoneyseqaccessmgrtest.cpp), alter(kcategoriesview.cpp,khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
51 {alter(ChangeLog), alter(configure.in.in), alter(acinclude.m4.in), alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneytest.cpp), alter(Makefile.am), alter(Makefile.am), alter(mymoneyofxstatement.cpp), alter(mymoneyofxstatement.h), alter(mymoneystatementreader.cpp), alter(mymoneystatementreader.h), alter(mymoneystatement.cpp), alter(mymoneystatement.h)}
52 {alter(kexportdlgdecl.ui), alter(kimportdlgdecl.ui), alter(knewloanwizarddecl.ui), alter(kofxdirectconnectdlgdecl.ui), alter(konlinequoteconfigurationdecl.ui), alter(ksplitcorrectiondlg.ui), alter(mymoneyqifprofileeditordecl.ui), alter(mymoneybudget.cpp), alter(mymoneybudget.h), alter(kbudgetview.cpp), alter(kbudgetview.h), alter(kbudgetviewdecl.ui), alter(kscheduledviewdecl.ui), alter(Makefile.am), alter(kmymoneyaccounttree.cpp), alter(kmymoneyaccounttree.h), alter(kmymoneyaccounttreebudget.cpp), alter(kmymoneyaccounttreebudget.h)}
53 {alter(mymoneyaccount.cpp), alter(mymoneyaccount.h), alter(mymoneycheckingaccount.cpp), alter(mymoneycheckingaccount.h), alter(mymoneycheckingaccounttest.h), alter(mymoneycheckingtransaction.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.h), alter(mymoneyinstitution.h), alter(mymoneyinstitutiontest.h), alter(mymoneymoneytest.h), alter(mymoneytransaction.h), alter(mymoneytransactiontest.h), alter(mymoneycheckingtransactiontest.h)}
241
54 {alter(ChangeLog), alter(kmymoney2.cpp), alter(knewuserwizard.cpp), alter(knewuserwizard.h), alter(knewuserwizard_p.h), alter(kpreferencepagedecl.ui), alter(userinfo.cpp), alter(userinfo.h), alter(userinfodecl.ui), alter(mymoneyreport.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kmymoneyview.h)}
55 {alter(Makefile.am), alter(kmymoney2.kdevprj), alter(Makefile.am), alter(kmymoney2.h), alter(kmymoney2ui.rc), alter(kfindtransactiondlg.cpp), alter(kupdatestockpricedlgdecl.ui), alter(Makefile.am), alter(mymoneyaccount.cpp), alter(mymoneyaccount.h), alter(mymoneyequity.cpp), alter(mymoneyequity.h), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(imymoneyserialize.h), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(mymoneyseqaccessmgrtest.cpp)}
56 {alter(kmymoneyutils.cpp), alter(kmymoneyutils.h), alter(main.cpp), alter(knewaccountdlg.cpp), alter(knewaccountwizard.cpp), alter(knewfiledlg.cpp), alter(ksettingsdlg.cpp), alter(home.html), alter(home_de.de.html), alter(home_fr.fr.html), alter(kcategoriesview.cpp), alter(kledgerview.cpp), alter(kledgerviewcheckings.cpp), alter(kledgerviewloan.cpp), alter(kmymoneyview.cpp), alter(kmymoneyview.h), alter(kmymoneyregister.cpp), alter(de.po), alter(fr.po)}
57 {alter(knewaccountwizard.cpp), alter(knewloanwizard.cpp), alter(transactioneditor.cpp), alter(mymoneybudget.h), alter(mymoneyscheduled.cpp), alter(mymoneyscheduled.h), alter(mymoneyscheduletest.cpp), alter(mymoneyscheduletest.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgrtest.cpp), alter(mymoneystoragedump.cpp), alter(mymoneystoragesql.cpp), alter(khomeview.cpp), alter(kscheduledlistitem.cpp), alter(kscheduledview.cpp), alter(register.cpp), alter(transaction.cpp), alter(keditscheduledlg.cpp), alter(keditscheduledlg.h), alter(ieditscheduledialog.cpp)}
242
58 {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(mymoneyaccount.h), alter(mymoneyaccounttest.cpp), alter(mymoneyaccounttest.h), alter(mymoneyfile.cpp), alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneyserialize.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(mymoneystoragedump.cpp), alter(mymoneystoragexml.cpp), alter(mymoneystoragexml.h), alter(kmymoneyview.cpp), alter(kmymoneyview.h)}
59 {alter(bottomleft.png), alter(topleft.png), alter(check-16.png), alter(check-20.png,frozen.png), alter(kmm-frozen.png), alter(lock-16.png), alter(newsplashcvs.png), alter(newsplashcvs2.png), alter(paperclip-diag.png), alter(paperclip-diag16.png), alter(paperclip-vert.png), alter(reconciled-frozen.png), alter(reconciled-frozen2.png)}
60 {alter(details-impexp.docbook), alter(details-investments.docbook), alter(gnucash-import_options.png), alter(Makefile.am), alter(mymoneygncreader.cpp), alter(mymoneygncreader.h), alter(webpricequote.cpp), alter(webpricequote.h), alter(kequitypriceupdatedlg.cpp), alter(kgncimportoptionsdlg.cpp), alter(kgncimportoptionsdlg.h), alter(kgncimportoptionsdlgdecl.ui), alter(knewinvestmentwizard.cpp), alter(knewinvestmentwizard.h)}
ทรานแซคชนชดทดสอบทงหมดจะถกน าไปสรางเปนขอสอบถามส าหรบสถานการณตางๆ 3 สถานการณตามขนตอนวธการสรางขอสอบถามทอธบายไวในบทท 3 จากทรานแซคชนขางตนสามารถน ามาแสดงตวอยางของขอสอบถามส าหรบแตละสถานการณไดดงน
ตวอยางขอสอบถามส าหรบสถานการณการน าทาง
จากทรานแซคชน {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)} สามารถน ามาสรางขอสอบถามไดทงหมด 2 ขอสอบถามดงน
243
- ขอสอบถามท 1 { {alter(kmymoney2.cpp)} , {alter(kmymoney2.h), alter(kmymoneyview.h)} } โดยท {alter(kmymoney2.cpp)} คอเซตเหตการณ และ {alter(kmymoney2.h), alter(kmymoneyview.h)} คอเซตของผลลพธทคาดไว
- ขอสอบถามท 2 { {alter(kmymoney2.h)} , {alter(kmymoney2.cpp), alter(kmymoneyview.h)} } โดยท {alter(kmymoney2.h)} คอเซตเหตการณ และ {alter(kmymoney2.cpp), alter(kmymoneyview.h)} คอเซตของผลลพธทคาดไว
- ขอสอบถามท 3 { {alter(kmymoneyview.h)} , {alter(kmymoney2.cpp), alter(kmymoney2.h)} } โดยท {alter(kmymoneyview.h)} คอเซตเหตการณ และ {alter(kmymoney2.cpp), alter(kmymoney2.h)} คอเซตของผลลพธทคาดไว
ตวอยางขอสอบถามส าหรบสถานการณการปองกนขอผดพลาด
จากทรานแซคชน {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)} สามารถน ามาสรางขอสอบถามไดทงหมด 3 ขอสอบถามดงน
- ขอสอบถามท 1 { {alter(kmymoney2.cpp), alter(kmymoney2.h)} , {alter(kmymoneyview.h)} } โดยท {alter(kmymoney2.cpp), alter(kmymoney2.h)} คอเซตเหตการณ และ {alter(kmymoneyview.h)} คอเซตของผลลพธทคาดไว
- ขอสอบถามท 2 { {alter(kmymoney2.cpp), alter(kmymoneyview.h)} , {alter(kmymoney2.cpp) } } โดยท {alter(kmymoney2.h), alter(kmymoneyview.h)} คอเซตเหตการณ และ {alter(kmymoney2.cpp)} คอเซตของผลลพธทคาดไว
- ขอสอบถามท 3 { {alter(kmymoneyview.h), alter(kmymoney2.cpp)} , {alter(kmymoney2.h)} } โดยท {alter(kmymoneyview.h), alter(kmymoney2.cpp)} คอเซตเหตการณ และ {alter(kmymoney2.h)} คอเซตของผลลพธทคาดไว
244
ตวอยางขอสอบถามส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว
จากทรานแซคชน {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)} สามารถน ามาสรางขอสอบถามไดทงหมด 1 ขอสอบถามดงน
- ขอสอบถามท 1 { {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)}, {} } โดยท {alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneyview.h)} คอเซตเหตการณ และเซตของผลลพธทคาดไวคอเซตวาง
245
ภาคผนวก ข ประเดนความถกตองและนาเชอถอของเครองมอทดสอบ...............
งานวจยนมขนตอนในการทดสอบทงหมด 6 ขนตอนดงรายละเอยดในหวขอ 3.6 และแสดงในรปท 3-1 ในขนตอนทง 6 ขนตอนดงกลาว 5 ขนตอนแรกจ าเปนตองใชเครองมอตางๆเขามาชวยในการทดสอบซงแสดงรายละเอยดในหวขอท 3.7 และรปท 3-5 ขนตอนแรกหรอขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ผวจยเลอกใชสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวของโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) สวนขนตอนอนๆไดแก ขนตอนการสรางขอสอบถามส าหรบการทดสอบ 3 สถานการณ ขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบ 3 สถานการณ ขนตอนการสรางเซตของค าแนะน าส าหรบเหตการณ และขนตอนการประเมนผลการทดสอบ ผ วจยจ าเปนตองพฒนาเครองมอทดสอบขนมาเองโดยใชภาษาพเอชพ (PHP) รวมกบระบบจดการฐานขอมลชอพเอชพมายแอดมน (PHPMyAdmin Database Management System) ผวจยจ าเปนตองค านงถงประเดนความถกตองและนาเชอถอของเครองมอทดสอบเหลานนดวย ผ วจยจงตองตรวจสอบความถกตองและแมนย าของเครองมอเหลานนในภาคผนวกน
ประเดนความถกตองและนาเชอถอของเครองมอทดสอบทผ วจยพฒนาขนมาเองทงหมด 4 เครองมอ แสดงดงตอไปน
เครองมอสรางขอสอบถามส าหรบ 3 สถานการณ
ขอมลออกผลลพธของเครองมอน คอ ขอสอบถามส าหรบ 3 สถานการณ แสดงในหวขอ 3.6.2 ผลลพธทออกมารวม 3 สถานการณจะไดทงหมด 962 ขอถามสอบ แบงเปนสถานการณการน าทาง 451 ขอสอบถาม สถานการการณการปองกนการเกดขอผดพลาด 451 ขอสอบถาม และสถานการณการเปลยนแปลงแกไขทสมบรณแลว 60 ขอสอบถาม ในสวนนผวจยสามารถใชการตรวจสอบแบบเดนผาน (Walkthrough) หรอการตรวจสอบเฉพาะผลลพธอยางไมเปนทางการกบผลลพธทงหมด 962 ขอสอบถามแยกตามขอก าหนดของแตละสถานการณได ผลการตรวจสอบแสดงใหเหนวาเครองมอสรางขอสอบถามส าหรบ 3 สถานการณใหผลลพธทมความถกตองและแมนย าทงหมด
246
เครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความ สมพนธดวยตวแบบท 2
ขอมลออกผลลพธของเครองมอทง 2 เครองมอน คอ กฎความสมพนธดวยตวแบบท 1 รวมถงคาสนบสนนคาความเชอมนของกฎความสมพนธและกฎความสมพนธดวยตวแบบท 2 รวมถงคาสนบสนนคาความเชอมนใหมของกฎความสมพนธ แสดงในหวขอ 3.6.3 กฎความสมพนธผลลพธทสรางออกมาคอกฎความสมพนธทงหมดทมคาความนาสนใจสงกวาคาทก าหนดไว ผวจยจงจ าเปนตองเลอกตวแทนของกฎความสมพนธทงหมดขนมาตรวจสอบหรอการตรวจสอบแบบสมตรวจ (Random Inspection) กบกฎความสมพนธดวยตวแบบท 1 และกฎความสมพนธดวยตวแบบท 2 การสมจะเปนการสมเลอกเซตรายการทมากอนทเปนตวแทนของเซตรายการทมากอนขนาดตางๆกน (สน กลางและยาว) และความถในการปรากฎตางๆกน (พบบอย และพบไมบอย) กฎความสมพนธทมเซตรายการทมากอนเหมอนกบเซตรายการทมากอนทก าหนดทงหมดจะถกเลอกออกมา เซตรายการทมากอนทถกเลอกขนมาเปนตวแทนทงหมด 10 เซตรายการดงน
ก าหนดให alter(x) คอ การเปลยนแปลงแกไขในมตแกไข (alter) เอนทต x โดยท x เปนเอนทตในระดบของแฟมขอมล แทนการเขยนแบบเตม alter(file, x, …) เพอความสะดวกในการแสดงขอมล
1. {alter(mymoneyfile.h)} 2. {alter(knewaccountwizard.cpp)} 3. {alter(kmymoney2.cpp), alter(kmymoney2.h)} 4. {alter(ChangeLog), alter(kmymoney2.cpp), alter(mymoneyaccount.cpp)} 5. {alter(imymoneystorage.h), alter(kmymoneyview.cpp)} 6. {alter(config.h.in), alter(acinclude.m4.in), alter(am_edit),
alter(conf.change.pl), alter(config.pl), alter(config.sub)} 7. {alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp), alter(mymoneyfile.h),
alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kcategoriesview.cpp), alter(khomeview.cpp),
247
alter(kmymoneyview.cpp), alter(kpayeesview.cpp)} 8. {alter(kmymoney2.cpp), alter(knewaccountdlg.cpp), alter(mymoneyfile.cpp),
alter(mymoneyfile.h), alter(mymoneyfiletest.cpp), alter(imymoneystorage.h), alter(mymoneyseqaccessmgr.cpp), alter(mymoneyseqaccessmgr.h), alter(kcategoriesview.cpp), alter(khomeview.cpp), alter(kmymoneyview.cpp), alter(kpayeesview.cpp)}
9. {alter(ChangeLog), alter(configure.in.in), alter(kmymoney2.cpp), alter(kmymoney2.h), alter(kmymoneytest.cpp), alter(Makefile.am), alter(Makefile.am), alter(mymoneyofxstatement.cpp), alter(mymoneyofxstatement.h), alter(mymoneystatementreader.cpp), alter(mymoneystatementreader.h), alter(mymoneystatement.cpp), alter(mymoneystatement.h)}
10. {alter(kexportdlgdecl.ui), alter(kimportdlgdecl.ui), alter(kofxdirectconnectdlgdecl.ui), alter(konlinequoteconfigurationdecl.ui), alter(ksplitcorrectiondlg.ui), alter(mymoneyqifprofileeditordecl.ui), alter(mymoneybudget.cpp), alter(mymoneybudget.h), alter(kbudgetview.cpp), alter(kbudgetview.h), alter(kbudgetviewdecl.ui), alter(kscheduledviewdecl.ui), alter(Makefile.am), alter(kmymoneyaccounttree.cpp), alter(kmymoneyaccounttree.h), alter(kmymoneyaccounttreebudget.cpp), alter(kmymoneyaccounttreebudget.h)}
เมอไดกฎความสมพนธทมเซตรายการทมากอนเหมอนเซตรายการขางตนนแลว น ากฎความสมพนธเหลานนมาจดเปนกลมตามเซตรายการทมกอนทเหมอนกน และตรวจสอบความถกตองของรายละเอยดตอไปน
1) ตรวจสอบคาสนบสนนนบของเซตรายการทมากอนภายในกลมเดยวกนจะตองเทากนทงหมด
248
2) ตรวจสอบภายในกลมเดยวกนวาไมมกฎความสมพนธทมเซตรายการทตามมาเหมอนกน
3) ตรวจสอบคาสนบสนนนบของกฎความสมพนธแตละตวในกลมวาค านวณถกตองหรอไม
4) ตรวจสอบคาความเชอมน/คาความเชอมนใหมของกฎความสมพนธแตละตวในกลมวาค านวณถกตองหรอไม
ผลการตรวจสอบแสดงใหเหนวาเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 เครองมอละ 2 ครงใหผลลพธทมความถกตองและแมนย าทงหมด
เครองมอสรางค าแนะน าส าหรบเหตการณ
ขอมลออกผลลพธของเครองมอน คอ เซตของค าแนะน าส าหรบเหตการณทเปนขอสอบถามทไดมาจากเครองมอสรางขอสอบถามส าหรบ 3 สถานการณ แสดงในหวขอ 3.6.4 เครองมอนมความตอเนองมาจากเครองมอกอนหนานโดยตรง กลาวคอกฎความสมพนธทไดมาจากเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 จะถกน ามาคนหากฎความสมพนธทมเซตรายการทมากอนเหมอนกบขอสอบถาม เมอไดมาแลวกฎความสมพนธเหลานนจะถกน ามาจดอนดบความนาสนใจตามคาความเชอมน /คาความเชอมนใหมของกฎความสมพนธ เซตรายการทตามของกฎความสมพนธ 10 อนดบแรกจะถกน ามายเนยนกนเปนเซตของกฎความสมพนธ ผวจยตรวจสอบความถกตองของเครองมอนโดยการตรวจสอบแบบสมตรวจ (Random Inspection) ผวจยใชเซตรายการ 10 เซตทสมมาจากหวขอทแลวมาเปนขอสอบถาม เซตของค าแนะน าทไดมาจากเครองมอนจะถกมาตรวจสอบดงตอไปน
1) ตรวจสอบสมาชกของเซตค าแนะน าวาสมาชกทซ ากนหรอไม 2) ตรวจสอบสมาชกของเซตค าแนะน าวาสมาชกทกตวมาเซตรายการทตามของกฎ
ความสมพนธทอยใน 10 อนดบแรกหรอไม 3) ตรวจสอบสมาชกของเซตรายการทตามมาของกฎความสมพนธ 10 อนดบแรกวาม
สมาชกตวใดไมไดอยในเซตค าแนะน า
249
4) กรณทมกฎความสมพนธทผานคาความเชอมนขนต า/คาความเชอมนใหมขนต า นอยกวา 10 กฎ สมาชกของเซตค าแนะน ากจะตองมาจากกฎความสมพนธนอยกวา 10 กฎนน
ผลการตรวจสอบแสดงใหเหนวาเครองมอสรางค าแนะน าส าหรบเหตการณทงหมด 2 ครงใหผลลพธทมความถกตองและแมนย าทงหมด
เครองมอประเมนผลการทดสอบ
ขอมลออกผลลพธของเครองมอน คอ คาประสทธภาพของการทดสอบทง 6 การทดสอบไดแกคาเอฟเมเชอรและคาผลสะทอนกลบ แสดงในหวขอ 3.6.5 เครองมอนมความตอเนองมาจากเครองมอกอนหนานโดยตรง กลาวคอเซตค าแนะน าทไดมาจากเครองมอสรางค าแนะน าส าหรบเหตการณจะถกน ามาประเมนกบเซตผลลพธทคาดไวของขอสอบถามทไดมาจากเครองมอสรางขอสอบถามส าหรบ 3 สถานการณ ผ วจยตรวจสอบความถกตองของเครองมอนโดยการตรวจสอบแบบสมตรวจ (Random Inspection) ผวจยใชเซตรายการ 10 เซตทสมมาจากหวขอทแลวมาเปนขอสอบถาม คาประสทธภาพของแตละขอสอบถามจะถกน ามาตรวจสอบความถกตองในการค านวณดงตอไปน
1) คาประสทธภาพทไดอยในชวงพสยทเปนไปไดของคาประสทธภาพนนหรอไม 2) ในกรณทเซตค าแนะน าเปนเซตวาง ท าใหการค านวณคาความถกตองมสวนเปน 0 คา
ความถกตองนนถกก าหนดใหมคาเปน 1 หรอไม 3) ในกรณทเซตของผลลพธทคาดไวเปนเซตวาง ท าใหการค านวณคาเรยกคนมสวนเปน
0 คาเรยกคนนนถกก าหนดใหมคาเปน 1 หรอไม 4) การค านวณคาประสทธภาพถกตองหรอไม
ผลการตรวจสอบแสดงใหเหนวาเครองมอประเมนผลการทดสอบทงหมด 2 ครงใหผลลพธทมความถกตองและแมนย าทงหมด
250
ภาคผนวก ค ตารางผลการทดสอบ
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 1 0.0000 0.1333
31 0.2000 0.1538
61 1.0000 0.7692
2 0.3333 0.2000
32 0.2222 0.1333
62 0.2000 0.0952 3 0.2857 0.2000
33 0.0000 0.0000
63 0.7143 0.7500
4 0.3333 0.2500
34 0.0000 0.0000
64 0.7692 0.7500 5 0.2857 0.2500
35 0.0000 0.0000
65 0.6667 0.7143
6 0.2857 0.2500
36 0.2857 0.3333
66 0.7692 0.7143 7 0.2500 0.2000
37 0.0000 0.0000
67 0.6667 0.7143
8 0.2857 0.2500
38 0.2857 0.2857
68 0.1538 0.1538 9 0.3333 0.2857
39 0.2500 0.1818
69 0.1818 0.1818
10 0.4000 0.2500
40 0.0000 0.0000
70 0.3333 0.6667 11 0.0000 0.1333
41 0.5714 0.5714
71 0.3333 0.3333
12 0.2857 0.2222
42 0.5714 0.4444
72 0.7273 0.7273 13 0.3333 0.2500
43 0.6667 0.3636
73 0.6000 0.6667
14 0.2857 0.2500
44 0.5000 0.4444
74 0.7273 0.5000 15 0.2500 0.2000
45 0.6667 0.4444
75 0.7273 0.7692
16 0.2857 0.2857
46 0.5714 0.5000
76 0.1538 0.1538 17 0.3333 0.2500
47 0.3333 0.2353
77 0.5333 0.7059
18 0.3333 0.2000
48 0.2500 0.2500
78 0.4286 0.7059 19 0.3333 0.2500
49 0.5000 0.5000
79 0.6154 0.7500
20 0.3333 0.2500
50 0.2222 0.3333
80 0.5714 0.5333 21 0.0000 0.0000
51 0.5000 0.5714
81 0.6154 0.5333
22 0.0000 0.0000
52 0.8000 0.7692
82 0.7143 0.7692 23 0.0000 0.0000
53 0.8000 0.8333
83 0.6667 0.7500
24 0.0000 0.0000
54 0.7273 0.8333
84 0.1429 0.1429 25 0.0000 0.0000
55 0.8000 0.6667
85 0.4000 0.6250
26 0.0000 0.0000
56 0.5000 0.5714
86 0.1176 0.1429 27 0.0000 0.2857
57 0.8000 0.7692
87 0.3529 0.5556
28 0.0000 0.2857
58 0.8000 0.8333
88 0.1176 0.2667 29 0.0000 0.0000
59 0.7273 0.8333
89 0.1250 0.2353
30 0.0000 0.0000
60 0.8000 0.8333
90 0.4000 0.5882
ภาคผนวก ค ตารางผลการทดสอบ
ตารางท ค-1 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการน าทาง
251
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 91 0.6667 0.6667
121 0.1818 0.3077
151 0.3333 0.1333
92 0.2667 0.3529
122 0.2000 0.4000
152 0.6154 0.5333 93 0.0000 0.0000
123 0.2857 0.1538
153 0.6667 0.6154
94 0.2500 0.3333
124 0.1818 0.1429
154 0.3750 0.1538 95 0.0000 0.0000
125 0.1818 0.0000
155 0.4615 0.4615
96 0.1250 0.0000
126 0.2857 0.0000
156 0.4615 0.4000 97 0.2500 0.4706
127 0.0000 0.0000
157 0.7143 0.4211
98 0.3750 0.3333
128 0.3077 0.4286
158 0.3333 0.4000 99 0.2857 0.3750
129 0.3077 0.2667
159 0.5333 0.4706
100 0.2857 0.2500
130 0.1667 0.2667
160 0.4615 0.6250 101 0.2667 0.2500
131 0.3077 0.1333
161 0.4286 0.4286
102 0.2667 0.4706
132 0.3333 0.4286
162 0.5000 0.5882 103 0.2667 0.4706
133 0.1429 0.0000
163 0.1250 0.1250
104 0.2500 0.4444
134 0.5455 0.5455
164 0.2500 0.5556 105 0.0000 0.0000
135 0.5333 0.5455
165 0.4706 0.6667
106 0.0000 0.2000
136 0.4286 0.5455
166 0.3158 0.3750 107 0.0000 0.0000
137 0.6154 0.5714
167 0.4211 0.6000
108 0.2857 0.2857
138 0.7143 0.7692
168 0.3158 0.4706 109 0.2222 0.2000
139 0.5455 0.5455
169 0.2222 0.3158
110 0.2500 0.2500
140 0.0000 0.0000
170 0.4706 0.7368 111 0.0000 0.0000
141 0.2857 0.4615
171 0.7059 0.7059
112 0.5000 0.4000
142 0.3636 0.4286
172 0.3529 0.4211 113 0.4444 0.4000
143 0.1538 0.1429
173 0.1176 0.1176
114 0.5000 0.4000
144 0.2500 0.3529
174 0.3333 0.4000 115 0.2222 0.3636
145 0.1333 0.1176
175 0.1250 0.1250
116 0.1818 0.3077
146 0.3077 0.3529
176 0.5263 0.7778 117 0.2000 0.3077
147 0.1429 0.1818
177 0.5000 0.6316
118 0.2000 0.1667
148 0.1667 0.1667
178 0.4706 0.4444 119 0.2000 0.2000
149 0.5000 0.6667
179 0.3333 0.4211
120 0.4444 0.3636
150 0.3077 0.1333
180 0.2222 0.3000
252
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
181 0.1176 0.3000
211 0.1111 0.1000
241 0.3750 0.4444 182 0.2353 0.3158
212 0.2222 0.4211
242 0.3529 0.3333
183 0.1176 0.1176
213 0.4444 0.5000
243 0.3529 0.5263 184 0.2000 0.4545
214 0.4706 0.5000
244 0.3529 0.5263
185 0.6000 0.7619
215 0.5000 0.5556
245 0.1176 0.1176 186 0.4211 0.9524
216 0.5000 0.5556
246 0.3333 0.5000
187 0.1250 0.1250
217 0.4706 0.4444
247 0.1176 0.1176 188 0.3333 0.5263
218 0.5000 0.4444
248 0.2105 0.0952
189 0.5556 0.6000
219 0.2353 0.4211
249 0.3158 0.5000 190 0.4706 0.6000
220 0.2353 0.4211
250 0.5263 0.5714
191 0.5000 0.6667
221 0.1111 0.3000
251 0.4444 0.5714 192 0.5000 0.5556
222 0.2222 0.4000
252 0.4706 0.6316
193 0.4706 0.4444
223 0.1250 0.1250
253 0.4706 0.5263 194 0.5000 0.4444
224 0.2222 0.1000
254 0.4444 0.4211
195 0.3529 0.5263
225 0.3333 0.4211
255 0.4706 0.4211 196 0.3529 0.5263
226 0.5556 0.6000
256 0.3333 0.5000
197 0.1176 0.1176
227 0.4706 0.6000
257 0.3333 0.5000 198 0.3333 0.5000
228 0.5000 0.6667
258 0.1111 0.1111
199 0.3333 0.5000
229 0.5000 0.5556
259 0.3158 0.4762 200 0.7000 0.8182
230 0.4706 0.4444
260 0.1250 0.0741
201 0.3529 0.6000
231 0.5000 0.4444
261 0.2857 0.2000 202 0.2222 0.5263
232 0.3529 0.4211
262 0.4211 0.5455
203 0.3529 0.4444
233 0.1176 0.1176
263 0.3333 0.4000 204 0.3750 0.3529
234 0.2222 0.4000
264 0.4444 0.5714
205 0.3750 0.3529
235 0.1250 0.1250
265 0.4444 0.6000 206 0.4000 0.3333
236 0.2222 0.1000
266 0.5263 0.6000
207 0.1176 0.0000
237 0.3333 0.5263
267 0.4444 0.6000 208 0.2222 0.1000
238 0.4444 0.5000
268 0.4444 0.4762
209 0.4706 0.5556
239 0.3529 0.5000
269 0.4211 0.3333 210 0.6250 0.7059
240 0.3750 0.5556
270 0.3158 0.2857
253
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 271 0.2105 0.3810
301 0.4444 0.4706
331 0.2727 0.3478
272 0.1053 0.1053
302 0.1667 0.1379
332 0.4000 0.4762 273 0.3000 0.2727
303 0.0870 0.0769
333 0.3000 0.5600
274 0.2500 0.1481
304 0.1600 0.0000
334 0.0000 0.0000 275 0.2222 0.2222
305 0.0000 0.0000
335 0.2667 0.2308
276 0.4762 0.4000
306 0.0000 0.0000
336 0.3529 0.3529 277 0.3000 0.1818
307 0.3478 0.3810
337 0.5000 0.5000
278 0.5000 0.5455
308 0.1905 0.2000
338 0.5000 0.5882 279 0.4211 0.5455
309 0.2857 0.4348
339 0.5000 0.5000
280 0.3333 0.5000
310 0.2857 0.3636
340 0.0000 0.0000 281 0.3333 0.5000
311 0.3478 0.3636
341 0.1250 0.1111
282 0.3333 0.5000
312 0.3636 0.4000
342 0.3333 0.3000 283 0.3333 0.3810
313 0.3636 0.3636
343 0.3333 0.3333
284 0.4211 0.3810
314 0.0833 0.0000
344 0.3750 0.2857 285 0.3158 0.4762
315 0.0000 0.0714
345 0.0000 0.0000
286 0.2105 0.2105
316 0.2500 0.0769
346 0.0000 0.0000 287 0.4000 0.3636
317 0.5600 0.5000
347 0.0000 0.0000
288 0.1250 0.0741
318 0.1053 0.0000
348 0.2857 0.4000 289 0.2353 0.0870
319 0.0000 0.0000
349 0.0741 0.0833
290 0.0909 0.0000
320 0.3158 0.3478
350 0.1600 0.0800 291 0.2222 0.2222
321 0.4000 0.4348
351 0.0833 0.1538
292 0.2222 0.2000
322 0.4444 0.6667
352 0.1667 0.3571 293 0.4211 0.2857
323 0.6667 0.6667
353 0.0000 0.0645
294 0.3000 0.1905
324 0.6667 0.6667
354 0.0000 0.0000 295 0.5263 0.6316
325 0.6667 0.6667
355 0.0690 0.0714
296 0.3750 0.3750
326 0.1905 0.1739
356 0.3200 0.2400 297 0.5714 0.4167
327 0.2000 0.1739
357 0.2500 0.3571
298 0.2667 0.2667
328 0.4211 0.6957
358 0.2400 0.2857 299 0.1053 0.0000
329 0.5000 0.3810
359 0.3200 0.3077
300 0.5556 0.4706
330 0.4000 0.4000
360 0.3200 0.2963
254
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 361 0.3846 0.3571
391 0.0000 0.0000
421 0.2857 0.2857
362 0.4000 0.3571
392 0.0714 0.0714
422 0.3158 0.2500 363 0.4167 0.4444
393 0.0000 0.0000
423 0.0000 0.0000
364 0.4167 0.4615
394 0.0000 0.0000
424 0.0000 0.0000 365 0.4000 0.4615
395 0.2308 0.2963
425 0.0000 0.0000
366 0.4167 0.4615
396 0.2400 0.1538
426 0.0000 0.0000 367 0.4167 0.4444
397 0.2308 0.2308
427 0.0000 0.0000
368 0.2500 0.3200
398 0.2500 0.1600
428 0.0000 0.0000 369 0.3333 0.4800
399 0.0000 0.0769
429 0.0000 0.0000
370 0.0870 0.2222
400 0.0833 0.0741
430 0.0000 0.0000 371 0.1600 0.1538
401 0.0800 0.0833
431 0.0000 0.0000
372 0.1600 0.2308
402 0.0870 0.0741
432 0.0000 0.0000 373 0.1600 0.0800
403 0.0000 0.0000
433 0.0000 0.0000
374 0.1667 0.3704
404 0.0769 0.2143
434 0.0000 0.0000 375 0.1667 0.1739
405 0.1600 0.0000
435 0.0000 0.0000
376 0.1818 0.1818
406 0.0000 0.0000
436 0.0000 0.0000 377 0.1739 0.1739
407 0.3000 0.3000
437 0.3333 0.2400
378 0.0833 0.1538
408 0.3000 0.3636
438 0.1739 0.2727 379 0.2500 0.2400
409 0.2857 0.2500
439 0.0000 0.0000
380 0.2609 0.1667
410 0.4762 0.2500
440 0.0000 0.0000 381 0.1818 0.1600
411 0.2727 0.0000
441 0.4211 0.3333
382 0.1667 0.0833
412 0.4545 0.5000
442 0.3333 0.3333 383 0.0909 0.1481
413 0.3810 0.5000
443 0.2105 0.1905
384 0.1667 0.2500
414 0.4000 0.5455
444 0.2222 0.2222 385 0.0870 0.0870
415 0.4000 0.5217
445 0.1818 0.0000
386 0.0909 0.0870
416 0.3810 0.3636
446 0.4762 0.5000 387 0.0000 0.0000
417 0.4000 0.3636
447 0.1333 0.1333
388 0.0000 0.0000
418 0.4762 0.5000
448 0.2353 0.2500 389 0.0000 0.0000
419 0.5455 0.6087
449 0.3333 0.2222
390 0.2143 0.1538
420 0.4000 0.5455
450 0.3529 0.2500
451 0.2105 0.0000
255
ตารางท ค-2 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการปองกนการเกดขอผดพลาด
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 1 0.0000 0.1333
31 0.2000 0.1538
61 0.2857 0.2222
2 0.3333 0.2000
32 0.2222 0.1333
62 0.2500 0.2000 3 0.2857 0.2000
33 0.0000 0.0000
63 0.2222 0.3333
4 0.3333 0.2500
34 0.0000 0.0000
64 0.2222 0.3333 5 0.2857 0.2500
35 0.0000 0.0000
65 0.2222 0.2857
6 0.2857 0.2500
36 0.2857 0.3333
66 0.2222 0.2857 7 0.2500 0.2000
37 0.0000 0.0000
67 0.2222 0.3333
8 0.2857 0.2500
38 0.2857 0.2857
68 0.2222 0.2500 9 0.3333 0.2857
39 0.2500 0.1818
69 0.3333 0.3333
10 0.4000 0.2500
40 0.0000 0.0000
70 0.3333 0.3333 11 0.0000 0.1333
41 0.4000 0.2000
71 0.3333 0.2500
12 0.2857 0.2222
42 0.2857 0.2222
72 0.3333 0.3333 13 0.3333 0.2500
43 0.2857 0.2222
73 0.3333 0.3333
14 0.2857 0.2500
44 0.2857 0.2857
74 0.3333 0.3333 15 0.2500 0.2000
45 0.3333 0.2000
75 0.3333 0.3333
16 0.2857 0.2857
46 0.2857 0.2857
76 0.2857 0.2222 17 0.3333 0.2500
47 0.3333 0.2222
77 0.2857 0.2500
18 0.3333 0.2000
48 0.3333 0.2000
78 0.2857 0.2500 19 0.3333 0.2500
49 0.2857 0.0000
79 0.2857 0.2500
20 0.3333 0.2500
50 0.2857 0.1538
80 0.2857 0.2500 21 0.0000 0.0000
51 0.2857 0.2500
81 0.2857 0.2500
22 0.0000 0.0000
52 0.2857 0.2000
82 0.2857 0.2500 23 0.0000 0.0000
53 0.3333 0.2222
83 0.2857 0.1818
24 0.0000 0.0000
54 0.3333 0.2222
84 0.2857 0.2500 25 0.0000 0.0000
55 0.0000 0.0000
85 0.2857 0.0000
26 0.0000 0.0000
56 0.2857 0.2500
86 0.2857 0.0000 27 0.0000 0.2857
57 0.2857 0.2000
87 0.2857 0.0000
28 0.0000 0.2857
58 0.3333 0.2222
88 0.2857 0.0000 29 0.0000 0.0000
59 0.3333 0.2222
89 0.2857 0.0000
30 0.0000 0.0000
60 0.3333 0.2222
90 0.2857 0.1667
256
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 91 0.2857 0.1818
121 0.2222 0.2222
151 0.5000 0.5000
92 0.2857 0.1818
122 0.2222 0.0000
152 0.5000 0.5000 93 0.2857 0.1818
123 0.2222 0.2222
153 0.5000 0.5000
94 0.2857 0.1818
124 0.2222 0.2500
154 0.0000 0.0000 95 0.4000 0.0000
125 0.2222 0.2222
155 0.0000 0.0000
96 0.4000 0.2222
126 0.0000 0.0000
156 0.0000 0.0000 97 0.4000 0.2000
127 0.3333 0.3333
157 0.0000 0.0000
98 0.4000 0.1667
128 0.3333 0.3333
158 0.0000 0.0000 99 0.4000 0.1667
129 0.3333 0.3333
159 0.0000 0.0000
100 0.4000 0.1818
130 0.3333 0.3333
160 0.0000 0.0000 101 0.4000 0.1818
131 0.3333 0.3333
161 0.0000 0.0000
102 0.4000 0.2000
132 0.3333 0.3333
162 0.0000 0.0000 103 0.4000 0.2000
133 0.0000 0.0000
163 0.1818 0.0000
104 0.4000 0.1818
134 0.0000 0.0000
164 0.1818 0.2000 105 0.1818 0.1538
135 0.0000 0.0000
165 0.1818 0.1818
106 0.0000 0.0000
136 0.0000 0.0000
166 0.1818 0.0000 107 0.0000 0.0000
137 0.0000 0.0000
167 0.1818 0.2000
108 0.2500 0.2222
138 0.0000 0.0000
168 0.1818 0.2000 109 0.0000 0.0000
139 0.0000 0.0000
169 0.1818 0.1818
110 0.2857 0.2857
140 0.0000 0.0000
170 0.1818 0.2000 111 0.0000 0.0000
141 0.1818 0.0000
171 0.1818 0.2000
112 0.4000 0.2222
142 0.1818 0.0000
172 0.1818 0.1818 113 0.4000 0.2857
143 0.1818 0.2222
173 0.1818 0.1818
114 0.4000 0.2500
144 0.0000 0.0000
174 0.1818 0.1818 115 0.0000 0.0000
145 0.1818 0.1818
175 0.1818 0.0000
116 0.2857 0.1818
146 0.1818 0.1818
176 0.1818 0.1667 117 0.2857 0.0000
147 0.5000 0.5000
177 0.1818 0.1667
118 0.0000 0.0000
148 0.3333 0.3333
178 0.1818 0.2500 119 0.2857 0.2222
149 0.5000 0.5000
179 0.1818 0.1818
120 0.2222 0.2222
150 0.5000 0.5000
180 0.1818 0.2222
257
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 181 0.1818 0.2222
211 0.2000 0.2000
241 0.2000 0.1818
182 0.1818 0.2500
212 0.2000 0.1818
242 0.2000 0.1818 183 0.1818 0.2222
213 0.2000 0.1667
243 0.2000 0.1667
184 0.1818 0.2857
214 0.2000 0.1667
244 0.2000 0.0000 185 0.1818 0.2500
215 0.2000 0.1538
245 0.2000 0.1667
186 0.1818 0.2500
216 0.2000 0.1667
246 0.2000 0.1818 187 0.2000 0.0000
217 0.2000 0.1667
247 0.1818 0.0000
188 0.2000 0.0000
218 0.2000 0.1667
248 0.1818 0.2000 189 0.2000 0.2000
219 0.2000 0.1538
249 0.1818 0.1667
190 0.2000 0.2000
220 0.2000 0.1538
250 0.1818 0.1538 191 0.2000 0.1667
221 0.0000 0.0000
251 0.1818 0.1538
192 0.2000 0.2000
222 0.2000 0.1667
252 0.1818 0.1667 193 0.2000 0.2000
223 0.0000 0.0000
253 0.1818 0.1667
194 0.2000 0.2000
224 0.2000 0.2000
254 0.1818 0.1538 195 0.2000 0.2000
225 0.2000 0.1818
255 0.1818 0.1667
196 0.2000 0.2000
226 0.2000 0.1333
256 0.1818 0.1429 197 0.2000 0.0000
227 0.0000 0.1429
257 0.1818 0.1538
198 0.2000 0.0000
228 0.0000 0.1538
258 0.1818 0.1538 199 0.2500 0.2500
229 0.0000 0.1667
259 0.1818 0.1538
200 0.2500 0.2500
230 0.0000 0.1538
260 0.2500 0.0000 201 0.2500 0.2857
231 0.0000 0.1667
261 0.2500 0.2500
202 0.2500 0.2857
232 0.0000 0.1429
262 0.2500 0.2500 203 0.2500 0.2500
233 0.0000 0.1538
263 0.2500 0.2857
204 0.2500 0.2857
234 0.0000 0.1429
264 0.2500 0.2857 205 0.2500 0.2500
235 0.2000 0.0000
265 0.2500 0.2857
206 0.2500 0.2857
236 0.2000 0.2000
266 0.2500 0.2500 207 0.2500 0.2500
237 0.2000 0.2000
267 0.2500 0.2857
208 0.2500 0.2500
238 0.2000 0.1538
268 0.2500 0.2857 209 0.2500 0.2500
239 0.2000 0.1538
269 0.2500 0.2500
210 0.2500 0.2500
240 0.2000 0.2000
270 0.2500 0.2857
258
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 271 0.2500 0.2500
301 0.0000 0.0000
331 0.0000 0.0000
272 0.2500 0.2500
302 0.0000 0.0000
332 0.0000 0.0000 273 0.2500 0.2500
303 0.0000 0.0000
333 0.0000 0.0000
274 0.2500 0.0000
304 0.0000 0.0000
334 0.0000 0.0000 275 0.2500 0.0000
305 0.0000 0.0000
335 0.0000 0.0000
276 0.2500 0.2500
306 0.0000 0.0000
336 0.0000 0.0000 277 0.2500 0.2500
307 0.0000 0.0000
337 0.0000 0.0000
278 0.2500 0.2500
308 0.0000 0.0000
338 0.0000 0.0000 279 0.2500 0.2500
309 0.0000 0.0000
339 0.0000 0.0000
280 0.2500 0.2500
310 0.0000 0.0000
340 0.0000 0.0000 281 0.2500 0.2500
311 0.0000 0.0000
341 0.0000 0.0000
282 0.2500 0.2500
312 0.0000 0.0000
342 0.0000 0.0000 283 0.2500 0.2500
313 0.0000 0.0000
343 0.0000 0.0000
284 0.2500 0.2500
314 0.0000 0.0000
344 0.0000 0.0000 285 0.2500 0.2500
315 0.0000 0.0000
345 0.0000 0.0000
286 0.2500 0.2500
316 0.0000 0.0000
346 0.0000 0.0000 287 0.2500 0.2500
317 0.0000 0.0000
347 0.0000 0.0000
288 0.0000 0.0000
318 0.0000 0.0000
348 0.0000 0.0000 289 0.0000 0.0000
319 0.0000 0.0000
349 0.0000 0.0000
290 0.0000 0.0000
320 0.0000 0.0000
350 0.0000 0.0000 291 0.0000 0.0000
321 0.0000 0.0000
351 0.0000 0.0000
292 0.0000 0.0000
322 0.0000 0.0000
352 0.0000 0.0000 293 0.0000 0.0000
323 0.0000 0.0000
353 0.0000 0.0000
294 0.0000 0.0000
324 0.0000 0.0000
354 0.0000 0.0000 295 0.0000 0.0000
325 0.0000 0.0000
355 0.0000 0.0000
296 0.0000 0.0000
326 0.0000 0.0000
356 0.0000 0.0000 297 0.0000 0.0000
327 0.0000 0.0000
357 0.0000 0.0000
298 0.0000 0.0000
328 0.0000 0.0000
358 0.0000 0.0000 299 0.0000 0.0000
329 0.0000 0.0000
359 0.0000 0.0000
300 0.0000 0.0000
330 0.0000 0.0000
360 0.0000 0.0000
259
คาเอฟเมสเชอร
คาเอฟเมสเชอร
คาเอฟเมสเชอร
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 361 0.0000 0.0000
391 0.0000 0.0000
421 0.0000 0.0000
362 0.0000 0.0000
392 0.0000 0.0000
422 0.0000 0.0000 363 0.0000 0.0000
393 0.0000 0.0000
423 0.0000 0.0000
364 0.0000 0.0000
394 0.0000 0.0000
424 0.0000 0.0000 365 0.0000 0.0000
395 0.0000 0.0000
425 0.0000 0.0000
366 0.0000 0.0000
396 0.0000 0.0000
426 0.0000 0.0000 367 0.0000 0.0000
397 0.0000 0.0000
427 0.0000 0.0000
368 0.0000 0.0000
398 0.0000 0.0000
428 0.0000 0.0000 369 0.0000 0.0000
399 0.0000 0.0000
429 0.0000 0.0000
370 0.0000 0.0000
400 0.0000 0.0000
430 0.0000 0.0000 371 0.0000 0.0000
401 0.0000 0.0000
431 0.0000 0.0000
372 0.0000 0.0000
402 0.0000 0.0000
432 0.0000 0.0000 373 0.0000 0.0000
403 0.0000 0.0000
433 0.0000 0.0000
374 0.0000 0.0000
404 0.0000 0.0000
434 0.0000 0.0000 375 0.0000 0.0000
405 0.0000 0.0000
435 0.0000 0.0000
376 0.0000 0.0000
406 0.0000 0.0000
436 0.0000 0.0000 377 0.0000 0.0000
407 0.0000 0.0000
437 0.0000 0.0000
378 0.0000 0.0000
408 0.0000 0.0000
438 0.0000 0.0000 379 0.0000 0.0000
409 0.0000 0.0000
439 0.0000 0.0000
380 0.0000 0.0000
410 0.0000 0.0000
440 0.0000 0.0000 381 0.0000 0.0000
411 0.0000 0.0000
441 0.0000 0.0000
382 0.0000 0.0000
412 0.0000 0.0000
442 0.0000 0.0000 383 0.0000 0.0000
413 0.0000 0.0000
443 0.0000 0.0000
384 0.0000 0.0000
414 0.0000 0.0000
444 0.0000 0.0000 385 0.0000 0.0000
415 0.0000 0.0000
445 0.0000 0.0000
386 0.0000 0.0000
416 0.0000 0.0000
446 0.0000 0.0000 387 0.0000 0.0000
417 0.0000 0.0000
447 0.0000 0.0000
388 0.0000 0.0000
418 0.0000 0.0000
448 0.0000 0.0000 389 0.0000 0.0000
419 0.0000 0.0000
449 0.0000 0.0000
390 0.0000 0.0000
420 0.0000 0.0000
450 0.0000 0.0000
451 0.0000 0.0000
260
ตารางท ค-3 แสดงขอสอบถามทไดเซตของค าแนะน าเปนเซตวางในการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว
เซตของค าแนะน า ทเปนเซตวาง
เซตของค าแนะน า ทเปนเซตวาง
เซตของค าแนะน า ทเปนเซตวาง
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2
ตวแบบท 1 ตวแบบท 2 1
21
41
2
22
42 3
23
43
4
24
44 5
25
45
6
26
46 7
27
47
8
28
48 9
29
49
10
30
50 11
31
51
12
32
52
13
33
53
14
34
54 15
35
55
16
36
56 17
37
57
18
38
58 19
39
59
20
40
60
เครองหมาย ในตารางท ข-3 หมายถงขอสอบถามในแถวนนท าใหไดเซตของค าแนะน าเปนเซตวางเมอน าไปสอบถามระบบใหค าแนะน าทใชการคนหากฎความสมพนธดวยตวแบบในหลกนน
261
ประวตผเขยนวทยานพนธ
นาย สญชย พทกษชลทรพย เกดวนท 25 ตลาคม พ.ศ. 2527 ส าเรจการศกษา วทยาศาสตรบณฑต สาขาวทยาการคอมพวเตอร จากภาควชาคณตศาสตร คณะวทยาศาสตร จฬาลงกรณมหาวทยาลย ในป พ.ศ. 2549 จากนนไดเขาศกษาตอในระดบปรญญาโท สาขาการพฒนาซอฟตแวรดานธรกจ ภาควชาสถต คณะพาณชยศาสตรและการบญช จฬาลงกรณมหาวทยาลย