Sekretāres problēma

No ''testwiki''
Versija 2025. gada 16. marts, plkst. 17.28, kādu to atstāja imported>DaceX
(izmaiņas) ← Senāka versija | skatīt pašreizējo versiju (izmaiņas) | Jaunāka versija → (izmaiņas)
Pāriet uz navigāciju Pāriet uz meklēšanu
Grafiks ar varbūtībām izvēliēties labāko kandidātu(sarkanie aplīši) un pirmais kandidāts kuru automātiski nenoraida k (zilie krustiņi).

Sekretāres problēma demostrē scenāriju optimālās stāšanas teorijā, kuru pēta lietišķā matemātikā, statistikā un varbūtību teorijā. Alternatīvi nosaukumi ir laulības problēma, sultāna pūra problēma, gogoļa spēle vai labākās izvēles problēma. Problēmas atrisinājumu dēvē par 37% likumu.

Problēmas scenārijs ir šāds: administrators vēlas pieņemt darbā vienu sekretāri no n kandidātiem, katra ar savu "labumu" vērtību. Kandidātes intervē pa vienai nejaušā secībā. Uzreiz pēc intervijas ir jāizlemj vai kandidāti pieņemt vai neņemt darbā. Līdz ko kandidāti noraida, pie šī kandidāta nevar atgriezties. Interviju procesā intervētājs uzzina par līdzšinējo kandidātu "labumu" vērtības, bet nezina neko par turpmākajiem kandidātiem. Sekretāres problēmas mērķis ir maksimizēt iespējas izvēlēties vislabāko sekretāri. Ja būtu iespējams atgriezties pie noraidītajiem kandidātiem, optimālā stratēģija būtu novērot visus kandidātus un pieņemt darbā vislabāko. Sarežģītība uzdevumā veidojas tādēļ, ka izvēle jāveic tūlīt pēc intervijas.

Problēmas risinājums paredz uzvaras varbūtību ne mazāku kā 1e ar nosacījumu, ka pirmos ne kandidātus intervē un noraida, pēc kuriem izvēlas nākamo labāko. Pārsteidzošas sekas no rezultāta, ka šim risinājumam ir vienalga par kandidātu skatītu n- simts vai miljons, varbūtība vēl joprojām ir ~37% izvēlēties labāko kandidātu.

Risinājums

Problēmas risinājums meklē kādu pieturas kandidātu, līdz kuram ievākt datus par kandidātu labumu tos noraidot, tad izvēlēties nākamo labāko. Pie šiem nosacījumiem pirmie k1 kandidāti tiek noraidīti un tiek izvēlēts nākamais labākais kandidāts. Ja tiek meklēts pirmais kandidāts k, kurš tiek apskatīts, varbūtību izvēlēties vislabāko kandidātu var pierakstīt kā:

P(k)=i=1nP(kandidātu i izvēlaskandidāts i ir labākais)=i=1nP(kandidātu i izvēlas|kandidāts i ir labākais)P(kandidāts i ir labākais)=[i=1k10+i=knP(labākais no pirmajiem i1 kandidātiemir starp pirmajiem k1 kandidātiem|kandidāts i ir labākais)]1n=[i=knk1i1]1n=k1ni=kn1i1.

Summu var aizstāt ar integrāli, jo starp katriem diviem kandidātiem kārtas skaitlis pieaug par viens- to var inteprētēt kā reizinājumu ar 1, kas neietekmē laukumu. Līdz ar to funkcijas augstums aptuveni precīzi apraksta laukumu zem līknes. Jo k ir lielāks, jo no taisnstūriem iegūtais laukums ir precīzāks.

Summa nav definēta pie k=1, taču tādā gadījumā tiek izvēlēts pirmais kandidāts un varbūtība tam būt labākajam ir P(k=1)=1n. Šo summu no k līdz n var aptuveni iegūt ar integrāli kn1i1di=lnnlnk=lnnk

Apvienojot izteiksmes iegūst:

P(k)=k1nlnnk. Ja šo izteiksmi atvasina pēc k un pielīdzina nullei, var atrast funkcijas pagrieziena punktu, kas atbilst maksimālajai varbūtībai.

dP(k)dk=1nlnnk1n+1nk=0, šai izteiksmei pie lieliem n kā atrisinājums der k=ne. Līdz ar to atraidot pirmos ne kandidātus un izvēloties nākamo labāko būs vislielākā varbūtība izvēlēties labāko. Lai uzzinātu pašu skaitlisko vērtību jāievieto k=ne varbūtības formulā:

P(k)=k1nlnnk, P(k=ne)=ne1nlnnne=1e1n, kas ir vienāds ar 1e, ja n ir liels. Šīs atbilst 37.8... % varbūtībai.

Kardinālās izmaksas versija

Ilustrācija gaidāmajai vērtībām katram kandidātam, ja ir dota tā relatīvā pozīcija.

Iespējams atrast vislabāko kandidātu ir pārāk strikts nosacījums. Viegli iztēloties, ka intervētājs redz pievienoto vērtību pieņemt vairāk vērtīgu kandidātu nekā mazāk vērtīgu kandidātu, neobligāti izvēloties labāko.

Lai modelētu šādu problēmas versiju, pieņemsim n kandidātiem piemīt "patiesās" novērotās vērtības, kas ir gadījuma lielumi vienādi un neatkarīgi izvēlēti no vienveidīga sadalījuma [0;1]. Līdzīgi kā sekretāres problēmā, intervētājs novēro tikai vai kandidāts ir labākais līdz šim, neiegūstot informāciju par līdzšinējo labumu. Intervētājam kandidāts uzreiz pēc intervijas uzreiz ir jāakceptē vai jānoraida. Ja neviens kandidāts netiek izvēlēts, jāizvēlas pēdējais.

Tālāk gaidāmo vērtību kā funkciju katram apstāšanās punktam var pierakstīt kā iteratīvu procesu:

Vn(t)=E(Xt|It=1)P(It=1)+Vn(t+1)

Šo formulu var interpretēt, ka katram skaitlim t, kur pirmos t1 kandidātus uzreiz noraida, iegūt gaidāmo vērtību nākamajam labākajam vai pēdējam kandidātam. Kad rēķina Vn(t+1) jāņem vērā varbūtība, piemēram, kandidātam t tikt izvēlētam, tādēļ tiek reizināts ar varbūtību, ka t kandidātu neizvēlas.

Katra t kandidāta gaidāmā vērtība, kad tas ir vislabākais līdz šim ir: Et=E(Xt|It=1)=tt+1. Savukārt varbūtība, ka t kandidāts ir līdz šim labākais ir: P(It=1)=1t1t=1t, kas atbilst varbūtībai kandidātam t būt labākam par gaidāmo maksimālo starp pirmajiem t1 kandidātiem. Tiek meklēts tāds pieturas punkts c, kur gaidāmās vērtības funkcija Vn(c) ir maksimālā. Izrakstot pirmos locekļus šai vērtības funkcijai iegūst:

Vn(t)=tt+11t+t+1t+21t+1(11t)+t+2t+31t+2(11t)(11t+1)+t+3t+41t+3(11t)(11t+1)(11t+2)...

=1t+1+1t+2t1t+1t+3t1ttt+1+1t+4t1ttt+1t+1t+2...

Šo garo izteiksmi var pierakstīt kodolīgāk un apskatīt tās daļas atsevišķi:

Vn(c)=t=cn1[s=ct1(s1s)](1t+1)+[s=cn1(s1s)]12.

Šo var apstrādāt sekojoši: s=ct1(s1s) apzīmē garo rindu ar varbūtību netikt izvēlētam iepriekšējiem gadījumam. Šo izrakstot kādam gadījumam t iegūst: s=ct1(s1s)=c1ccc+1c+1c+2...t3t2t2t1=c1t1. Aizvietojot šīs lielās reizinājuma zīmes ar iznākumu un izrakstot c1 konstanti ārpus summas iegūst:

Vn(c)=(c1)t=cn1(1t11t+1)+c1n112

Tālāk var apstrādāt summu: t=cn1(1t11t+1)=12t=cn1(1t11t+1), izrakstot šīs summas pirmos un pēdējos locekļus:

12t=cn1(1t11t+1)=1c11c+1+1c1c+2+1c+11c+3+...+1n41n2+1n31n1+1n21n

12t=cn1(1t11t+1)=12(1c11c+1+1c1c+2+1c+11c+3+...+1n41n2+1n31n1+1n21n)

=12(1c1+1c1n11n).[1] Ievietojot izteiksmē iegūst:

Vn(c)=(c1)12(1c1+1c1n11n)+c1n112=2cnc2+cn2cn. Tā kā mums interesē pie kura pieturas punkta c šī funkcija ir maksimāla, jāatvasina un jāpielīdzina funkcija nullei:

δVn(c)δc=12c212n=0 un c=n, kas nozīmē pirmā kvadrātsakne no n kandidātiem ir jānoraida un jāizvēlas nākamais labākais, lai sagaidāmās funkcijas vērtība būtu maksimāla. Ievietojot šo vērtību sagaidāmās vērtības funkcijā iegūst: Vn(c=n)=2nnn+nn2nn=11n+12n, kas ir skaitliskā vērtība izvēlētajam kandidātam.

Atsauces

Veidne:Atsauces