La teoría matemática de la información se basa en la teoría de las probabilidades y las estadísticas, y mide la información con varias cantidades del de la información . La opción de la base logarítmica en las fórmulas siguientes determina la unidad de entropía de información se utilice que. La unidad más común de información es el pedacito, basado en el logaritmo binario . Otras unidades incluyen el nacional, basado en el logaritmo natural, y el hartley, basado en la base 10 o el logaritmo ordinario .
En qué sigue, una expresión del es considerada por la convención ser igual a cero siempre que sea el p . Se justifica esto porque para cualquier base logarítmica.
Uno mismo-información
Shannon derivó una medida del contenido de información llamada la Uno mismo-información del o " del ; surprisal" de un m del mensaje:
donde es la probabilidad que el m del mensaje está elegido de todas las opciones posibles en el espacio de mensaje . La base del logaritmo afecta solamente a un factor de escala y, por lo tanto, a las unidades en los cuales se exprese el contenido de información medido. Si el logaritmo es la base 2, la medida de información se expresa en unidades de los pedacitos
La información se transfiere de una fuente a un recipiente solamente si el recipiente de la información no tenía ya la información a comenzar con. Los mensajes que transportan la información que sucede seguramente y sabido ya por el recipiente no contienen ninguna información verdadera. Los mensajes infrecuentemente de ocurrencia contienen más información que mensajes más con frecuencia de ocurrencia. Este el hecho se refleja en la ecuación antedicha (un mensaje de cierta probabilidad tiene una medida de información de cero). Además, un mensaje compuesto de dos (o más) (o mutuamente la independiente) mensajes sin relación tendrían una cantidad de información que es la suma de las medidas de información de cada mensaje individualmente. Ese hecho también se refleja en la ecuación antedicha, apoyando la validez de su derivación.
Un ejemplo: La difusión de la previsión metereológica es: " Pronóstico de la esta noche: Oscuro. Oscuridad continua hasta luz extensamente dispersada en el morning." Este mensaje no contiene ninguna información. Sin embargo, un pronóstico de una tempestad de nieve contendría ciertamente la información puesto que no sucede tal cada tarde. Aun más ser una gran cantidad de información en un pronóstico exacto de la nieve para una localización caliente, tal como Miami .
Entropía
La
entropía del de un espacio de mensaje discreto
es una medida de la cantidad de la incertidumbre uno del tiene sobre qué mensaje será elegido. Se define como la uno mismo-información del promedio de un mensaje
de ese
espacio de mensaje:
donde
denota la operación del valor previsto .
Una característica importante de la entropía es que está maximizada cuando todos los mensajes en el espacio de mensaje son equiprobables (e. el ). En este caso