Los postulados de la mecánica cuántica

Transcripción

Los postulados de la mecánica cuántica
Los postulados de la mecánica cuántica
Introducción
Von Neumann dice en el prefacio de su libro [Mathematical foundations
of quantum mechanics, 1932] que su propósito es presentar a la mecánica
cuántica en forma matemáticamente rigurosa. Por esto entiende: considerar operadores no acotados, trabajar con los operadores mismos, sin representarlos en coordenadas como matrices, evitar la “ficción” de que todos
los operadores autoadjuntos se pueden diagonalizar (usando funciones mal
definidas). Para hacerlo, desarrolla la teorı́a de transformaciones basada en
la teorı́a de operadores en H.
Como la mecánica cuántica es una teorı́a probabilı́stica, tendrá que -por
un lado- definir cuáles son los eventos sobre los que predicar probabilidades
(relación de las proposiciones/preguntas sı́-no con los proyectores, conectivos
entre proposiciones como operaciones entre proyectores) y -por otro- caracterizar esa probabilidad en forma matemáticamente rigurosa y relacionarla
con la experiencia fı́sica.
Axiomas de la mecánica cuántica
vN1 Sistema fı́sico. La interpretación matemática de un sistema cuántico
es un espacio de Hilbert complejo separable H.
vN2 Estado del sistema. Los estados puros se representan matemáticamente
por vectores unitarios |ϕi en H. Los estados que no necesariamente
corresponden a información máxima se llaman mezclas. Se repre†
sentan
P por operatores ρPpositivos tipo traza, ρ = ρ con trρ = 1,
ρ = ri |ϕihϕ|, ri > 0,
ri = 1.
vN3 Eventos. Los eventos relativos al sistema se representan matemáticamente por operadores de proyección P , P 2 = P (correspondientemente
subespacios cerrados) sobre H.
1
vN4 Observables. Una cantidad fı́sica u observable, que puede medirse,
del sistema está representada por una PVM (projection valued measure) o, equivalentemente, por su operador autoadjunto asociado. Para
cualquier operador A asociado a la magnitud A y conjunto de Borel
∆, la interpretación fı́sica de la proyección P (∆) es el evento “el observable representado por A tiene un valor en ∆”.
vN5 La probabilidad. La probabilidad p(ρ, P ) de que el sistema que está
en el estado ρ satisfaga un evento P está dada por la regla de Born:
p(ρ, P ) = tr(ρP ).
vN6 Evolución. La evolución espontánea de los estados del sistema está
determinada por la ecuación de Schrödinger. Es decir, ∃ U (to , t)
U † (to , t) = U −1 (to , t) = U (t, to ), U (to , t) = exp[−ıH(t − to )]
tq
|ψ(t)i = U (to , t)|ψ(to )i
vN7 Postulado de proyección (de von Neumann-Lüders). Para procedimientos de medicióon no destructivos, en el caso de observables discretos y estados puros, “la función de onda colapsa” de la siguiente
manera:
X
X
X
A=
ai Pi =
ai |ϕi ihϕi |, |ψi =
ci ϕi i
si el resultado es aj , |ψi 7→ |ϕj i. Y, en general, si el estado es ρ y el
resultado ∆,
ρ 7→ P (∆)ρP ∆)/tr(ρP (∆)
vN8 Sistemas compuestos. Si H1 y H2 son las representaciones matemáticas
de dos sistemas 1 y 2, la representación del sistema compuesto es
H1 ⊗ H2 .
Comentarios
Estados: lo que interesa caracterizar es el ı́nfimo de las propiedades actuales
(ı́nfimo en el sentido del lattice de proyectores). A diferencia del caso clásico,
en que el estado hace referencia a la posición e impulso de un sistema determinado, el estado cuántico hace referencia al procedimiento de preparación.
Por eso se suele definir al estado como la clase de equivalencia de los procedimientos para prepararlo. Un estado |+i no requiere especificación acerca
2
de si se trata de haber preparado electrones, átomos, protones o qué, basta
que con ellos se consiga un autovector con autovalores 1/2(1/2 + 1) de S 2 y
1/2 de Sz .
Más de los estados: von Neumann se refiere a estados puros (máxima información) y mezclas estadı́sticas (“mezclas propias”, relacionadas con la
ignorancia sobre las proporciones de estados puros presentes en el estado).
Hay otra clase de estados que no son ni unos ni otros, las “mezclas impropias”, que provienen de trazas parciales y no admiten interpretación por
ignorancia.
Más de los estados: como la mq es probabilı́stica, dado un estado puro
|ψ > y un evento P (proposición experimental desde el punto de vista de
la lógica), el estado puede asignar a P valores 0 = f also, 1 = verdadero,
o un número en [0, 1] = semánticamente indeterminado. Entonces, por un
lado los estados puros representan el máximo admisible de información y
por otro esa info es lógicamente incompleta.
Eventos: la estructura del conjunto de eventos sobre el que se predicarán
probabilidades no es la de un lattice booleano como el de los eventos clásicos
sino que es la de un lattice modular para dim finita y ortomodular para dim
infinita (orden parcial: inclusión de subespacios, ∧: intersección de subespacios, ∨: el menor subespacio que contiene a la unión, complemento: el
complemento ortogonal). El lattice de los subespacios de Hilbert es (teo)
atómico, irreducible y satisface la propiedad de cubrimiento. Los átomos
son los rayos. (Covering law: dados a, x ∈ L(H), p estado, a < x <
a ∨ p ⇒ x = a o x = a ∨ p; modular: si dados x ≤ y, y para todo z
se cumple x ∨ (y ∧ z) = y ∧ (x ∨ z) entonces el lattice es modular; si dados
x ≤ y, x⊥ ≤ z vale esa igualdad, es ortomodular. Modular ⇒ ortomodular.)
Más sobre eventos: hay otra posibilidad además de la descomposición en
proyectores queP
corresponde a las PVMs. Es la descomposión (redundante)
en “efectos” E, Ei = 1, pero E 2 6= E. A la medida que corresponde a esta
descomposición se la llama “positive operator valued measure” (POVM) y
el álgebra de los eventos E es lamentable, en el sentido de que no cierran
las operaciones, hay que completar, y las propiedades satisfacen versiones
“débiles” de las usuales, otra biblioteca.
Observables: los observables clásicos, como la energı́a o el momento angular, son funciones de las variables canónicas p, q con las que se identifica
3
el estado del sistema (un punto en el espacio de las fases); ası́, el estado
del sistema determina los valores de todas las magnitudes. Cuánticamente,
los observables se consideran en forma independiente del estado. Los valores posibles son los del espectro. Entonces, la preparación del sistema no
determina los valores de las magnitudes, que vienen de otro lado; lo que sı́
determina es la probabilidad de obtener algún valor al medir una magnitud
y también el valor medio de las magnitudes.
Evolución: hay una evolución para sistemas aislados que es reversible y otra
para el proceso de medición, que no lo es. El argumento de von Neumann
para el colapso es que, si se mide la energı́a, el resultado debe reobtenerse
al volver a medir. Hay otras razones: la de Heisenberg que relaciona al
estado del sistema con la información que de él se tiene, entonces el estado
después de la medición tiene que dar cuenta (en forma discontinua) de lo
nuevo que se sabe por haber medido. Alternativa: considerar el proceso de
medición como una interacción con hamiltoniano propio, etc ,→ “problema
de la medición”.
Más de la evolución: la versión de la ecuación de Schrödinger para estados
mezcla es la ecuación de von Neumann: ρ(t) = U (to , t)ρ(to )U (to , t).
Si los sistemas compuestos son de indistinguibles, no todos los estados son
realizables y hay que agregar el postulado de simetrización.
Las probabilidades
Los observables están representados por PVMs. El mapa
P : B(<) → P(H)
que asigna a cada conjunto de Borel sobre < un proyector sobre H es una
PVM que satisface
P (0) = 0, P (I) = 1, P (< − di ) = I − P (di ) = P ⊥ (di )
X
P (∪i di ) =
Pi (di ), di disjuntos.
Si P es una PVM, µP (ϕ, φ)(d) definida por
d 7→ µP (ϕ, φ)(d) = hϕ|P (d)|φi
4
es una medida compleja.
Los estados, por su parte, se usan para calcular probabilidades de eventos,
es decir, de proyectores. Entonces el estado podrı́a pensarse como un mapa
ϕ : P(H) → [0, 1]
tq
ϕ(0) = 0; ϕ(P ⊥ ) = 1 − ϕ(P ) ϕ(∨Pi ) =
X
ϕ(Pi )
Pi familia ortogonal, ∨ del lattice de eventos.
El mapa ϕ es como una probabilidad. Compuesta con la PVM,
µ = ϕ ◦ µP
es una medida de probabilidad sobre <:
d → Pi → [0, 1]
Que existan estados |ϕi o ρ que puedan ponerse en correspondencia con
estos mapas ϕ no es algo obvio. El teorema de Gleason asegura que existen:
Theorem 0.1 Si dim(H)≥ 3, para cada mapa ϕ existe un operador positivo,
autoadjunto tipo traza ρ con tr(ρ) = 1 tq ϕ(P ) = tr(ρP ). Y al revés, cada
ρ determina un mapa ϕ que asigna esta probabilidad al evento P .
A diferencia del caso clásico en que hay una medida definida por el estado, aquı́ hay muchas (una PVM por cada magnitud fı́sica). Para acotados,
tr(ρP ) tiene sentido, y se puede extender de proyectores a operadores:
p(P ) = tr(ρP ) → integrando con la µ que por el teorema
corresponde a cada ρ → tr(ρA) = hAi
Con esto, valores medios, momentos, dispersiones, etc:
Z
M m (ρA) = (id< )m dµ(ρ, P A ) con µ(ρ, P A )(d) = tr(ρP A (d))
Entonces el valor medio es
Z
hAiρ =
(id)< dµ(ρ, P A ) = tr(ρA)
y también se puede calcular la dispersión:
σρ2 (A) = hA2 iρ − hAi2ρ
5
Theorem 0.2 (de Heisenberg) Sean A, B, C operadores autoadjuntos sobre H con dominios D(A), D(B), D(C) y sea ϕ el mapa del operador densidad ρ. Sea que:
i) ∃D = D(A) ∩ D(B) ∩ D(C) subespacio denso en H
ii) tq (AB − BA)|ψi = ı C|ψi, |ψi ∈ D
P
iii) Si alguno de los operadores es no acotado, ρ = ri |ξi ihξi | con |ξi i ∈ D
es de rango finito; si son todos acotados, ρ es arbitrario.
Entonces, σA · σB ≥ (1/4)|hCiρ |2
Los operadores acotados para los que vale la igualdad se llaman complementarios. Para dim ∞,
Definition 0.3 Dos operadores autoadjuntos A, B sobre un H con dim(H) =
∞ se dicen complementarios uno de otro si
tr(P A (E)P B (G)) =
1
µ(E)µ(G)
2π
para conjuntos de Borel E, G < ∞, µ la medida de Lebesgue sobre los <.
Sean P (no proyector sino el impulso, misma letra!) y Q los observables
canónicamente conjugados impulso y posición de una partı́cula libre en una
dim. Entonces P , Q son complementarios.
0.1
Las variables ocultas
En el ámbito de la mecánica clásica, la versión estadı́stica está vinculada a la
imposibilidad material de conocer las condiciones iniciales del gran número
de partı́culas que componen al sistema (tı́picamente 1023 para un gas en un
recipiente) y de resolver todas sus ecuaciones, en general acopladas, además
de la inutilidad de hacerlo. Por eso el problema se trata probabilı́sticamente.
Sin embargo, en principio, es posible afirmar que existe un estado que en
todo momento está bien definido, aunque no sepamos o no nos interese saber
cuál es. Un tal estado es un punto en el espacio de las fases, que evoluciona
determinı́sticamente. Puntos ası́ pueden identificarse con las medidas de
Dirac concentradas en los puntos. Las medidas de Dirac son los estados sin
dispersión de la mecánica estadı́stica clásica. Mientras preparaba su libro,
von Neumann estaba estudiando problemas de mecánica estadı́stica clásica:
los tres paper de cuántica son de 1927 (el que es con Hilbert y Nordheim y
6
los dos solo), el libro es de 1932 y en el medio publicó su prueba del teorema
ergódico, y del teorema H (1929) y, en 1932, la prueba del quasiergódico y
tres papers más de mecánica estadı́stica. En el libro demuestra que el caso
cuántico es otra historia:
Definition 0.4 Si σρ (A) = 0 para todo A, entonces ρ se dice sin dispersión
(dispersion free)
Proposition 0.5 (de von Neumann) Si dim(H) > 2, no existen estados
sin dispersión.
La demostraciôn de von Neumann es controvertida pero lo importante
es que su idea era mostrar la imposibilidad de interpretar las probabilidades
cuánticas en términos de ignorancia. Después viene mucho trabajo en el
tema: las demostraciones de Bell del 64 y 66, el experimento de Aspect y
compañı́a del 81, la demostración de Jauch y Piron del 63 en términos de
lattices, la de Misra del 67 en la formulación algebraica, ...
0.1.1
Bell à la Wigner
Sea un par de indistinguibles de spin 1/2 (por ejemplo, electrones) en estado
singlete
1
√ [| + −i − | − +i]
2
{|+i, |−i} la base en que diagonaliza σz ,
[σx , σy ] = ı σz y cı́clicas
σς |±i = ±|±i en toda dirección ς
(siempre ~ = 1). Sean dos direcciones 1, 2 formando ángulo α12 en las que
→
quiero referirme a las componentes de −
σ . Las probabilidades predichas por
la teorı́a de obtener, al medir, los cuatro diferentes resultados posibles son:
p++ = p−− =
1
α12
1
α12
sin2
; p+− = p−+ = cos2
2
2
2
2
Sea que, aunque no pueda determinarlas simultáneamente, las componentes del spin existan. Entonces, se trata de ver cómo asignarles valores.
Notación: con (+ − +; − − +) se indica la probabilidad de una partı́cula
tenga componentes del spin + en dirección 1, − en 2, + en 3 y la otra − en
1 y 2, + en 3. Son dos partı́culas, tres componentes del spin, dos autovalores
7
cada componente, entonces hay 26 = 64 de estos paréntesis. Casi todos son
cero por la condición de indistinguibles, quedan ocho que se agrupan de a
dos de nuevo por la indistinguibilidad:
(+ + +; − − −) = (− − −; + + +)
(+ + −; − − +) = (− − +; + + −)
(+ − −; − + +) = (− + +; + − −)
(− + −; + − +) = (+ − +; − + −)
Si las componentes del spin son propiedades que las partı́culas tienen, ¿cuál
es la probabiidad escrita en términos de estos paréntesis, que son los que
dan cuenta de ello, de que una tenga componente + en dirección 1 y la otra
+ en dirección 2? Es:
p1+2+ = (+ − +; − + −) + (− + −; + − +)
El formalismo predice que vale
p1+2+ =
1
α12
sin2
2
2
Puedo repetir esto para
p2+3+ =
1
α23
1
α13
sin2
y para p1+3+ = sin2
2
2
2
2
Ahora calculo
sin2
α12
α23
+ sin2
2
2
en términos de los paréntesis:
α12
α23
+ sin2
= 2(+ − +; − + −) + 2(+ − −; − + +) + 2(+ + −; − − +)+
2
2
α13
+2(− + −; + − +) = 2(+ − +; − + −) + 2(− + −; + − +) + sin2
2
Como los paréntesis son probabilidades multiplicadas por dos, son ≥ 0,
entonces, desigualdades de Bell:
sin2
sin2
α12
α23
α13
sin2
≥ sin2
2
2
2
Para el caso α12 = α23 = π/3 y α13 = 2π/3, la desigualdad se viola.
Es que usando que las propiedades existen independientemente de todo, se
está sumando probabilidades y no amplitudes de probabilidad. Es posible
testear experimentalmente → varios intentos → precauciones experimentales
en relación a la localidad → Aspect, etc. → experimentalmente se violan.
8
0.1.2
El teorema de Kochen-Specker
Las desigualdades de Bell son violadas por predicciones estadı́sticas acerca
de correlaciones y dependen del estado (en el ejemplo, probabilidades de
encontrar las componentes del spin en ciertas direcciones de dos electrones
en estado singlete). Pero hay contradicciones que pueden derivarse usando
sólo el álgebra de los operadores y sin particularizar el estado, entonces:
una demostración algebraica de la contradicción que genera suponer que los
sistemas poseen propiedades.
Sean tres observables A, B y C tales que [A, B] = [A, C] = 0 pero
[B, C] 6= 0. Además, dado un autovector |ϕi común a A y B, es cierto que
vale la consistencia funcional
si A|ϕi = a|ϕi, B|ϕi = b|ϕi → f (A, B)|ϕi = f (a, b)|ϕi
1. No contextualidad: supongo que existen los valores de A. Eso querrı́a
decir que el valor de la propiedad A es independiente de si la determino
sola, junto con B o junto con C (son tres mediciones que se pueden
hacer).
2. Consistencia funcional: puedo afirmar que, sin medir ya que estoy
suponiendo que las propiedades existen, los autovalores de las funciones de observables son las funciones de los autovalores.
La pregunta es: ¿se puede sostener la no-contextualidad de las propiedades
junto con la consistencia funcional para los tres observables A, B, C? La
respuesta es no.
Ejemplo: de nuevo las proyecciones del spin para para dos partı́culas. Se
arman observables del espacio de Hilbert producto tensorial que conmuten
y se les asignan valores posibles.
1 ⊗ σz
σz ⊗ 1
σz ⊗ σz
σx ⊗ 1
1 ⊗ σx
σx ⊗ σx
σx ⊗ σz σz ⊗ σx σy ⊗ σy
Todos tienen autovalores ±1; conmutan entre sı́ en cada fila y en cada
columna; en las filas, el tercero es producto de los dos anteriores; en las
columnas también, aunque en el caso de la tercer columna hay un signo
menos. Entonces, si hago una tabla con los valores posibles salvo para
σy ⊗ σy , todo anda bien. Ahora supongo, por ejemplo, que el valor de σz y
9
el de σx es uno y calculo el valor de σy ⊗σy por el lado de las filas. Obtengo 1
ya que (σx ⊗ σz ) (σz ⊗ σx ) = σy ⊗ σy . Si lo hago por el lado de las columnas,
como (σz ⊗ σz ) (σx ⊗ σx ) = −(σy ⊗ σy ), me da −1, y resulta inconsistente.
En general:
Theorem 0.6 (de Kochen-Specker, 1967) Si dim(H) > 2 es imposible asignar valores numéricos 1 ó 0 a cada proyector
P Pi de tal manera que, si un
conjunto de Pi que conmutan satisfacenP Pi = 1, sus correspondientes
valores v(Pi ), que son 1 ó 0, satisfagan
v(Pi ) = 1.
La necesidad de las álgebras de von Neumann
En el paper que llamaron quantum logic, Birkhoff y von Neumann proponı́an
la estructura que debı́a reemplazar a la de las proposiciones/eventos de la
mecánica clásica. Ahı́ enfatizaban que la lógica cuántica, esa estructura
que ellos llamaron lógica cuántica, tiene la estructura de “una geometrı́a
proyectiva abstracta”, entendiendo por eso un lattice ortocomplementado
modular. Como para el caso de dim = ∞ el lattice no es modular, cosa
que ellos sabı́an, el lattice de Hilbert no es -para ellos- la lógica cuántica.
La razón detrás del requerimiento de modularidad es la necesidad de una
generalización del concepto de probabilidad que fuera adecuada a la mq y a
la vez matemáticamente rigurosa.
Clásicamente la probabilidad puede verse como una medida normalizada
µ sobre el álgebra booleana de los eventos (clásicos), y tiene la propiedad
µ(A) + µ(B) = µ(A ∧ B) + µ(A ∨ B)
que es una de las propiedades que define una función dimensión sobre el
lattice:
Definition 0.7 Un mapa d definido sobre un lattice L y que toma valores
no negativos (tal vez infinitos) se llama dimension function si satisface:
1. d(A) < d(B) si A antecede a B
2. d(A) + d(B) = d(A ∧ B) + d(A ∨ B)
Proposition 0.8 Si existe una función dimensión sobre un lattice L que
toma valores finitos, el lattice es modular.
10
Para caracterizar la probabilidad en el caso en que se haga estadı́stica, von
Neumann considera un ensamble a priori completamente inespecı́fico (fundamentale Gesamtheit, absoluter Gleichgewichtszustand, también “ensamble que corresponde a temperatura infinita”) a partir del cual se seleccionará
el ensamble que tenga las propiedades que dicen cuál es el estado. Cualquier
ensamble se obtiene a partir del inespecı́fico por selección: se arma una subcolección del ensamble original con los elementos que satisfacen una dada
propiedad. Él llama “relativa” a la probabilidad, no porque sea probabilidad condicional, sino porque no necesariamente está normalizada. A la
normalizada la llama “absoluta”.
A partir de los axiomas, de esta forma de armar el ensamble extrayendo
del inespecı́fico los elementos que tienen cierta propiedad y relacionando frecuecias con valores medios, von Neumann llega a que cada ensamble puede
describirse por un operador ρ positivo, no nulo, tipo traza, que sirve para
calcular probabilidades como tr(ρA). En el ensamble a priori están los
sistemas preparados en todos los estados (puros) concebibles con “igual frecuencia relativa” (sus palabras). El ρ de tal cosa es el operador identidad.
En la argumentación utiliza que ρ representa una mezcla estadı́stica y
que describe ensambles preparados en estados puro Pi = |ψi ihψi |,
X
ρ=
λ i Pi
cada uno con peso λi . El peso a priori de cada estado (puro) es 1, que es
igual a la traza (dimensión) del proyector unidimensional que le corresponde.
La argumentación tiene la dificultad de que el operador densidad de la
mezcla inespecı́fica tiene traza infinita. No hay una probabilidad no nula aditiva sobre el conjunto de proyectores sobre H que dé la distribución uniforme
en el “ensamble a priori” y entonces los pesos relativos no pueden ponerse
en correspondencia con frecuencias relativas en el ensamble, que siempre
deben ser ≤ 1. Además, el ensamble contiene una cantidad no numerable de
elementos (las proyecciones unidimensionales sobre H) que también va en
contra de encontrar un sentido a las frecuencias relativas. Y von Neumann
no querı́a dejar de relacionar las probabilidades con frecuencias, para él los
ensambles de la mq son lo que von Mises llama “Kollektive”.
La respuesta de von Neumann a sus problemas es radical: la aparición
de “probabilidades a priori” infinitas (probabilidades que le son necesarias
en su desarrollo) es una patologı́a (en el sentido de una definición rigurosa
de la probabilidad) del espacio de Hilbert. Entonces, por razones fı́sicas, hay
que buscar la definición rigurosa por otro lado, y desarrolla las *-álgebras.
11