El problema de la secretaria del es un problema de detención óptimo que se ha estudiado extensivamente en los campos de la probabilidad aplicada, de las estadísticas, y de la teoría de decisión . También se conoce como el problema de la unión del, el problema de la dote del sultán del, el problema quisquilloso del pretendiente del, y problema bien escogido el mejor. El problema puede ser indicado como sigue:

allí es una sola posición de secretaria a llenar.

  • Hay aspirantes de n para la posición, y se sabe esto.
  • Los aspirantes pueden ser alineados de mejor a la peor sin lazos.
  • Los aspirantes se entrevistan con secuencialmente en una orden al azar, con cada orden siendo igualmente probable.
  • Después de que se acepte o se rechace cada entrevista, el aspirante.
  • La decisión a acepta o rechaza a aspirante se puede basar solamente en las filas relativas de los aspirantes entrevistados con hasta ahora.
  • Los aspirantes rechazados no pueden ser recordados.
  • El objeto es seleccionar al mejor aspirante. La rentabilidad es 1 para el mejor aspirante y cero de otra manera.

    Digamos que un aspirante es un candidato del solamente si es mejor que todos los aspirantes vistos previamente. Claramente, puesto que el objetivo en el problema es seleccionar al solo mejor aspirante, sólo considerarán a los candidatos para la aceptación. Una razón por la que el problema de la secretaria ha recibido tanto la atención es que la política óptima para el problema (el que para la regla ) tiene una característica asombrosamente. Específicamente, porque n grande la política óptima es saltar a los primeros aspirantes e de n/ y después aceptar al candidato siguiente que es mejor que todo el ésos entrevistados con previamente, donde está la base e del logaritmo natural . Mientras que n consigue más grande, la probabilidad de seleccionar al mejor aspirante de la piscina va a 1/e, que es el alrededor 37%. Si uno está buscando a través de 100 o 100.000 aspirantes, la política óptima seleccionará el solo mejor un cerca de 37% del tiempo.

    Derivación de la política óptima

    La política óptima para el problema es un que para la regla . Debajo de ella, el entrevistador debe saltar a los primeros aspirantes de r-1, y después toma a aspirante siguiente que es un candidato (es decir, que tiene la mejor graduación relativa de ésos entrevistada con hasta ese punto). Para un atajo arbitrario r, la probabilidad que seleccionan al mejor aspirante está

    P (r)= \ sum_ {j=r} ^ {} \ dejado de n (\ frac {1} {n} \ derecho) \ ido (\ frac {r-1} {j-1} \ derecho) = \ ido (\ frac {r-1} {n} \ derecho) \ sum_ {j=r} ^ {} \ dejado de n (\ frac {1} {j-1} \ derecho).

    Dejando n tender al infinito, escribiendo x como el límite de r/n, usar t para j/n y dt para 1/n, la suma se puede aproximar por el integral

    P (r)=x \ int_ {x} ^ {1} \ dejado (\ frac {1} {t} \ derecho) despegue = - x \ texto {registro} (x).

    Tomar el derivado del P (r) con respecto a x, fijándolo a 0, y solucionándolo para x, encontramos que el x óptimo es igual a 1/e. Así, el atajo óptimo tiende a n/e mientras que n aumenta, y seleccionan al mejor aspirante con la probabilidad 1/e.

    Para los pequeños valores de n, el r óptimo se puede también obtener por métodos estándar de la programación dinámica . Los umbrales óptimos r y la probabilidad de seleccionar la mejor alternativa P para varios valores de n se demuestran en la tabla siguiente.

    Funcionamiento heurístico

    Stein, Seale, y Rapoport (2003) derivaron las probabilidades de éxito previstas para varios la heurística psicologicamente plausible que se pudo emplear en el problema de la secretaria. La heurística que examinaron eran:
    del

    la regla del atajo (CR): no aceptan a primeros aspirantes uces de los de y; después de eso, seleccionar a primer candidato encontrado (es decir, aspirante con la fila relativa 1). Esta regla tiene como caso especial la política óptima para el CSP para el cual y=r.
    Regla de la cuenta del candidato del (CCR): seleccionan a candidato encontrado y. La nota, esa esta regla no salta necesario a ninguna aspirantes; considera solamente han observado a cuántos candidatos, no cómo profundamente el responsable está en la secuencia del aspirante.
    Regla sucesiva del Non-Candidate del (SNCR): seleccionan a primer candidato encontrado después de observar a los non-candidates de y (es decir, aspirantes con la fila relativa >1).

  • Observar que cada uno heurístico tiene un solo parámetro y. La figura (demostrada en la derecha) exhibe las probabilidades de éxito previstas para cada uno heurístico en función de y para los problemas con n=80.

    Variante cardinal de la rentabilidad

    Encontrar al solo mejor aspirante pudo parecer como un objetivo algo terminante. Uno puede imaginarse que el entrevistador contrataría algo a aspirante alto-valorado que infravalorado, y no sólo se trate a conseguir el mejor. Es decir, ella derivará un cierto valor de seleccionar a un aspirante que no sea necesario el mejor, y el valor que ella deriva está aumentando del valor de el ella selecciona.

    Para modelar este problema, suponer que los aspirantes de n tienen " true" valores que son el dibujado X al azar I.d de las variables de una distribución del uniforme en . Similar al problema clásico descrito arriba, el entrevistador observa solamente si cada aspirante es el mejor hasta ahora (un candidato), debe aceptar o rechazar cada uno sobre el terreno, y el debe aceptar el pasado si lo alcanzan. (Para estar claro, el entrevistador no aprende la fila relativa real de cada aspirante de . Ella aprende solamente si el aspirante tiene fila relativa 1.) sin embargo, en esta versión que su rentabilidad del es dado por el valor verdadero del aspirante seleccionado. Por ejemplo, si ella selecciona a aspirante cuyo valor verdadero es 0.8, después ella ganará 0. El objetivo del entrevistador es maximizar el valor previsto del aspirante seleccionado.

    Puesto que son los valores del aspirante i.d extrae de una distribución uniforme en , el valor previsto del aspirante de tth dado que el x_ {t} = \ máximo \ se fue \ {x_ {1}, x_ {2}, \ los ldots, el x_ {t} \ derecho \} es dado cerca

    El =E de E_ {t} \ se fue (X_ {t}|I_ {t} =1 \) = derecho \ frac {t} {t+1}.

    Como en el problema clásico, la política óptima es dada por un umbral, que para este problema denotaremos por c, en el cual el entrevistador debe comenzar a aceptar a candidatos. Bearden (2006) demostró que c es \ el lfloor \ raíz cuadrada n \ rfloor o \ el lceil \ raíz cuadrada n \ rceil. Esto sigue del hecho de que dado un problema con los aspirantes de n, es la rentabilidad prevista para un cierto umbral arbitrario 1 \ leq c \ leq n

    V_ {n} (c)= \ sum_ {t=c} ^ {n-1} \ dejado \ dejado (\ frac {1} {t+1} \ derechos) + \ dejado \ frac {1} {2} = {\ frac {^ 2cn- {c} {2} +c-n} {2cn}}.

    Distinguiendo el V_ {n} (c) con respecto a c, uno consigue el \ V parcial/\ parcial c= \ ido (- {c} ^ {\, 2} +n \) derecho/\ (2 ^ {c} {\, 2} n \ derecho) dejado. Desde el \ el partial^ {\, 2} V/\ c^ parcial {\, 2} <0 para todo permitido los valores de c, encontramos que V está maximizado en el c= \ raíz cuadrada n. Puesto que V es convexo en c, el umbral número-valorado óptimo debe ser \ el lfloor \ raíz cuadrada n \ rfloor o \ el lceil \ raíz cuadrada n \ rceil. Así, porque la mayoría de los valores de n que el entrevistador comenzará a aceptar a aspirantes más pronto en la versión cardinal de la rentabilidad que en la versión clásica donde está seleccionar el objetivo al solo mejor aspirante. Observar que esto no es un resultado asintótico: Se sostiene para todo el n.

    Otras variantes

    Un número de otras variaciones del problema clásico de la secretaria se han propuesto.

    Estudios experimentales

    Los psicólogos y los economistas experimentales han estudiado el comportamiento de decisión de la gente real en problemas de la secretaria. En parte grande, este trabajo ha demostrado que la gente tiende a parar el buscar demasiado pronto. Esto se puede explicar, por lo menos en parte, por el coste de evaluar a candidatos. Extrapolando a los ajustes del mundo real, esto pudo sugerir que la gente no busca bastantes siempre que la hagan frente con los problemas donde las alternativas de la decisión se encuentran secuencialmente. Por ejemplo, al intentar decidir en qué gasolinera no pudo buscar parar para el gas, gente bastantes antes de parar. Si son verdades, entonces tenderían a pagar más gas que pudieron los tenían buscaron más de largo. Iguales pueden ser verdades cuando la búsqueda de gente en línea para los boletos de línea aérea, dice. La investigación experimental sobre problemas tales como el problema de la secretaria se refiere a veces como la investigación de operaciones del comportamiento .

    Citaciones

    eflist

    .

  • Zenithic
  • David C. Robinson
    Random links:Felicitas | Fernando Rigaux | Manatee de Africa Occidental | Paul Kehoe | Ormož

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">