Los postulados de la mecánica cuántica

Transcripción

Los postulados de la mecánica cuántica
Introducción
Von Neumann dice en el prefacio de su libro [Mathematical foundations
of quantum mechanics, 1932] que su propósito es presentar a la mecánica
cuántica en forma matemáticamente rigurosa. Por esto entiende: considerar operadores no acotados, trabajar con los operadores mismos, sin representarlos en coordenadas como matrices, evitar la “ficción” de que todos
los operadores autoadjuntos se pueden diagonalizar (usando funciones mal
definidas). Para hacerlo, desarrolla la teorı́a de transformaciones basada en
la teorı́a de operadores en H.
Como la mecánica cuántica es una teorı́a probabilı́stica, tendrá que -por
un lado- definir cuáles son los eventos sobre los que predicar probabilidades
(relación de las proposiciones/preguntas sı́-no con los proyectores, conectivos
entre proposiciones como operaciones entre proyectores) y -por otro- caracterizar esa probabilidad en forma matemáticamente rigurosa y relacionarla
con la experiencia fı́sica.
Axiomas de la mecánica cuántica
vN1 Sistema fı́sico. La interpretación matemática de un sistema cuántico
es un espacio de Hilbert complejo separable H.
vN2 Estado del sistema. Los estados puros se representan matemáticamente
por vectores unitarios |ϕi en H. Los estados que no necesariamente
corresponden a información máxima se llaman mezclas. Se repre†
sentan
P por operatores ρPpositivos tipo traza, ρ = ρ con trρ = 1,
ρ = ri |ϕihϕ|, ri > 0,
ri = 1.
vN3 Eventos. Los eventos relativos al sistema se representan matemáticamente por operadores de proyección P , P 2 = P (correspondientemente
subespacios cerrados) sobre H.
1
vN4 Observables. Una cantidad fı́sica u observable, que puede medirse,
del sistema está representada por una PVM (projection valued measure) o, equivalentemente, por su operador autoadjunto asociado. Para
cualquier operador A asociado a la magnitud A y conjunto de Borel
∆, la interpretación fı́sica de la proyección P (∆) es el evento “el observable representado por A tiene un valor en ∆”.
vN5 La probabilidad. La probabilidad p(ρ, P ) de que el sistema que está
en el estado ρ satisfaga un evento P está dada por la regla de Born:
p(ρ, P ) = tr(ρP ).
vN6 Evolución. La evolución espontánea de los estados del sistema está
determinada por la ecuación de Schrödinger. Es decir, ∃ U (to , t)
U † (to , t) = U −1 (to , t) = U (t, to ), U (to , t) = exp[−ıH(t − to )]
tq
|ψ(t)i = U (to , t)|ψ(to )i
vN7 Postulado de proyección (de von Neumann-Lüders). Para procedimientos de medicióon no destructivos, en el caso de observables discretos y estados puros, “la función de onda colapsa” de la siguiente
manera:
X
X
X
A=
ai Pi =
ai |ϕi ihϕi |, |ψi =
ci ϕi i
si el resultado es aj , |ψi 7→ |ϕj i. Y, en general, si el estado es ρ y el
resultado ∆,
ρ 7→ P (∆)ρP ∆)/tr(ρP (∆)
vN8 Sistemas compuestos. Si H1 y H2 son las representaciones matemáticas
de dos sistemas 1 y 2, la representación del sistema compuesto es
H1 ⊗ H2 .
Comentarios
Estados: lo que interesa caracterizar es el ı́nfimo de las propiedades actuales
(ı́nfimo en el sentido del lattice de proyectores). A diferencia del caso clásico,
en que el estado hace referencia a la posición e impulso de un sistema determinado, el estado cuántico hace referencia al procedimiento de preparación.
Por eso se suele definir al estado como la clase de equivalencia de los procedimientos para prepararlo. Un estado |+i no requiere especificación acerca
2
de si se trata de haber preparado electrones, átomos, protones o qué, basta
que con ellos se consiga un autovector con autovalores 1/2(1/2 + 1) de S 2 y
1/2 de Sz .
Más de los estados: von Neumann se refiere a estados puros (máxima información) y mezclas estadı́sticas (“mezclas propias”, relacionadas con la
ignorancia sobre las proporciones de estados puros presentes en el estado).
Hay otra clase de estados que no son ni unos ni otros, las “mezclas impropias”, que provienen de trazas parciales y no admiten interpretación por
ignorancia.
Más de los estados: como la mq es probabilı́stica, dado un estado puro
|ψ > y un evento P (proposición experimental desde el punto de vista de
la lógica), el estado puede asignar a P valores 0 = f also, 1 = verdadero,
o un número en [0, 1] = semánticamente indeterminado. Entonces, por un
lado los estados puros representan el máximo admisible de información y
por otro esa info es lógicamente incompleta.
Eventos: la estructura del conjunto de eventos sobre el que se predicarán
probabilidades no es la de un lattice booleano como el de los eventos clásicos
sino que es la de un lattice modular para dim finita y ortomodular para dim
infinita (orden parcial: inclusión de subespacios, ∧: intersección de subespacios, ∨: el menor subespacio que contiene a la unión, complemento: el
complemento ortogonal). El lattice de los subespacios de Hilbert es (teo)
atómico, irreducible y satisface la propiedad de cubrimiento. Los átomos
son los rayos. (Covering law: dados a, x ∈ L(H), p estado, a < x <
a ∨ p ⇒ x = a o x = a ∨ p; modular: si dados x ≤ y, y para todo z
se cumple x ∨ (y ∧ z) = y ∧ (x ∨ z) entonces el lattice es modular; si dados
x ≤ y, x⊥ ≤ z vale esa igualdad, es ortomodular. Modular ⇒ ortomodular.)
Más sobre eventos: hay otra posibilidad además de la descomposición en
proyectores queP
corresponde a las PVMs. Es la descomposión (redundante)
en “efectos” E, Ei = 1, pero E 2 6= E. A la medida que corresponde a esta
descomposición se la llama “positive operator valued measure” (POVM) y
el álgebra de los eventos E es lamentable, en el sentido de que no cierran
las operaciones, hay que completar, y las propiedades satisfacen versiones
“débiles” de las usuales, otra biblioteca.
Observables: los observables clásicos, como la energı́a o el momento angular, son funciones de las variables canónicas p, q con las que se identifica
3
el estado del sistema (un punto en el espacio de las fases); ası́, el estado
del sistema determina los valores de todas las magnitudes. Cuánticamente,
los observables se consideran en forma independiente del estado. Los valores posibles son los del espectro. Entonces, la preparación del sistema no
determina los valores de las magnitudes, que vienen de otro lado; lo que sı́
determina es la probabilidad de obtener algún valor al medir una magnitud
y también el valor medio de las magnitudes.
Evolución: hay una evolución para sistemas aislados que es reversible y otra
para el proceso de medición, que no lo es. El argumento de von Neumann
para el colapso es que, si se mide la energı́a, el resultado debe reobtenerse
al volver a medir. Hay otras razones: la de Heisenberg que relaciona al
estado del sistema con la información que de él se tiene, entonces el estado
después de la medición tiene que dar cuenta (en forma discontinua) de lo
nuevo que se sabe por haber medido. Alternativa: considerar el proceso de
medición como una interacción con hamiltoniano propio, etc ,→ “problema
de la medición”.
Más de la evolución: la versión de la ecuación de Schrödinger para estados
mezcla es la ecuación de von Neumann: ρ(t) = U (to , t)ρ(to )U (to , t).
Si los sistemas compuestos son de indistinguibles, no todos los estados son
realizables y hay que agregar el postulado de simetrización.
Las probabilidades
Los observables están representados por PVMs. El mapa
P : B(<) → P(H)
que asigna a cada conjunto de Borel sobre < un proyector sobre H es una
PVM que satisface
P (0) = 0, P (I) = 1, P (< − di ) = I − P (di ) = P ⊥ (di )
X
P (∪i di ) =
Pi (di ), di disjuntos.
Si P es una PVM, µP (ϕ, φ)(d) definida por
d 7→ µP (ϕ, φ)(d) = hϕ|P (d)|φi
4
es una medida compleja.
Los estados, por su parte, se usan para calcular probabilidades de eventos,
es decir, de proyectores. Entonces el estado podrı́a pensarse como un mapa
ϕ : P(H) → [0, 1]
tq
ϕ(0) = 0; ϕ(P ⊥ ) = 1 − ϕ(P ) ϕ(∨Pi ) =
X
ϕ(Pi )
Pi familia ortogonal, ∨ del lattice de eventos.
El mapa ϕ es como una probabilidad. Compuesta con la PVM,
µ = ϕ ◦ µP
es una medida de probabilidad sobre <:
d → Pi → [0, 1]
Que existan estados |ϕi o ρ que puedan ponerse en correspondencia con
estos mapas ϕ no es algo obvio. El teorema de Gleason asegura que existen:
Theorem 0.1 Si dim(H)≥ 3, para cada mapa ϕ existe un operador positivo,
autoadjunto tipo traza ρ con tr(ρ) = 1 tq ϕ(P ) = tr(ρP ). Y al revés, cada
ρ determina un mapa ϕ que asigna esta probabilidad al evento P .
A diferencia del caso clásico en que hay una medida definida por el estado, aquı́ hay muchas (una PVM por cada magnitud fı́sica). Para acotados,
tr(ρP ) tiene sentido, y se puede extender de proyectores a operadores:
p(P ) = tr(ρP ) → integrando con la µ que por el teorema
corresponde a cada ρ → tr(ρA) = hAi
Con esto, valores medios, momentos, dispersiones, etc:
Z
M m (ρA) = (id< )m dµ(ρ, P A ) con µ(ρ, P A )(d) = tr(ρP A (d))
Entonces el valor medio es
Z
hAiρ =
(id)< dµ(ρ, P A ) = tr(ρA)
y también se puede calcular la dispersión:
σρ2 (A) = hA2 iρ − hAi2ρ
5
Theorem 0.2 (de Heisenberg) Sean A, B, C operadores autoadjuntos sobre H con dominios D(A), D(B), D(C) y sea ϕ el mapa del operador densidad ρ. Sea que:
i) ∃D = D(A) ∩ D(B) ∩ D(C) subespacio denso en H
ii) tq (AB − BA)|ψi = ı C|ψi, |ψi ∈ D
P
iii) Si alguno de los operadores es no acotado, ρ = ri |ξi ihξi | con |ξi i ∈ D
es de rango finito; si son todos acotados, ρ es arbitrario.
Entonces, σA · σB ≥ (1/4)|hCiρ |2
Los operadores acotados para los que vale la igualdad se llaman complementarios. Para dim ∞,
Definition 0.3 Dos operadores autoadjuntos A, B sobre un H con dim(H) =
∞ se dicen complementarios uno de otro si
tr(P A (E)P B (G)) =
1
µ(E)µ(G)
2π
para conjuntos de Borel E, G < ∞, µ la medida de Lebesgue sobre los <.
Sean P (no proyector sino el impulso, misma letra!) y Q los observables
canónicamente conjugados impulso y posición de una partı́cula libre en una
dim. Entonces P , Q son complementarios.
0.1
Las variables ocultas
En el ámbito de la mecánica clásica, la versión estadı́stica está vinculada a la
imposibilidad material de conocer las condiciones iniciales del gran número
de partı́culas que componen al sistema (tı́picamente 1023 para un gas en un
recipiente) y de resolver todas sus ecuaciones, en general acopladas, además
de la inutilidad de hacerlo. Por eso el problema se trata probabilı́sticamente.
Sin embargo, en principio, es posible afirmar que existe un estado que en
todo momento está bien definido, aunque no sepamos o no nos interese saber
cuál es. Un tal estado es un punto en el espacio de las fases, que evoluciona
determinı́sticamente. Puntos ası́ pueden identificarse con las medidas de
Dirac concentradas en los puntos. Las medidas de Dirac son los estados sin
dispersión de la mecánica estadı́stica clásica. Mientras preparaba su libro,
von Neumann estaba estudiando problemas de mecánica estadı́stica clásica:
los tres paper de cuántica son de 1927 (el que es con Hilbert y Nordheim y
6
los dos solo), el libro es de 1932 y en el medio publicó su prueba del teorema
ergódico, y del teorema H (1929) y, en 1932, la prueba del quasiergódico y
tres papers más de mecánica estadı́stica. En el libro demuestra que el caso
cuántico es otra historia:
Definition 0.4 Si σρ (A) = 0 para todo A, entonces ρ se dice sin dispersión
(dispersion free)
Proposition 0.5 (de von Neumann) Si dim(H) > 2, no existen estados
sin dispersión.
La demostraciôn de von Neumann es controvertida pero lo importante
es que su idea era mostrar la imposibilidad de interpretar las probabilidades
cuánticas en términos de ignorancia. Después viene mucho trabajo en el
tema: las demostraciones de Bell del 64 y 66, el experimento de Aspect y
compañı́a del 81, la demostración de Jauch y Piron del 63 en términos de
lattices, la de Misra del 67 en la formulación algebraica, ...
0.1.1
Bell à la Wigner
Sea un par de indistinguibles de spin 1/2 (por ejemplo, electrones) en estado
singlete
1
√ [| + −i − | − +i]
2
{|+i, |−i} la base en que diagonaliza σz ,
[σx , σy ] = ı σz y cı́clicas
σς |±i = ±|±i en toda dirección ς
(siempre ~ = 1). Sean dos direcciones 1, 2 formando ángulo α12 en las que
→
quiero referirme a las componentes de −
σ . Las probabilidades predichas por
la teorı́a de obtener, al medir, los cuatro diferentes resultados posibles son:
p++ = p−− =
1
α12
1
α12
sin2
; p+− = p−+ = cos2
2
2
2
2
Sea que, aunque no pueda determinarlas simultáneamente, las componentes del spin existan. Entonces, se trata de ver cómo asignarles valores.
Notación: con (+ − +; − − +) se indica la probabilidad de una partı́cula
tenga componentes del spin + en dirección 1, − en 2, + en 3 y la otra − en
1 y 2, + en 3. Son dos partı́culas, tres componentes del spin, dos autovalores
7
cada componente, entonces hay 26 = 64 de estos paréntesis. Casi todos son
cero por la condición de indistinguibles, quedan ocho que se agrupan de a
dos de nuevo por la indistinguibilidad:
(+ + +; − − −) = (− − −; + + +)
(+ + −; − − +) = (− − +; + + −)
(+ − −; − + +) = (− + +; + − −)
(− + −; + − +) = (+ − +; − + −)
Si las componentes del spin son propiedades que las partı́culas tienen, ¿cuál
es la probabiidad escrita en términos de estos paréntesis, que son los que
dan cuenta de ello, de que una tenga componente + en dirección 1 y la otra
+ en dirección 2? Es:
p1+2+ = (+ − +; − + −) + (− + −; + − +)
El formalismo predice que vale
p1+2+ =
1
α12
sin2
2
2
Puedo repetir esto para
p2+3+ =
1
α23
1
α13
sin2
y para p1+3+ = sin2
2
2
2
2
Ahora calculo
sin2
α12
α23
+ sin2
2
2
en términos de los paréntesis:
α12
α23
+ sin2
= 2(+ − +; − + −) + 2(+ − −; − + +) + 2(+ + −; − − +)+
2
2
α13
+2(− + −; + − +) = 2(+ − +; − + −) + 2(− + −; + − +) + sin2
2
Como los paréntesis son probabilidades multiplicadas por dos, son ≥ 0,
entonces, desigualdades de Bell:
sin2
sin2
α12
α23
α13
sin2
≥ sin2
2
2
2
Para el caso α12 = α23 = π/3 y α13 = 2π/3, la desigualdad se viola.
Es que usando que las propiedades existen independientemente de todo, se
está sumando probabilidades y no amplitudes de probabilidad. Es posible
testear experimentalmente → varios intentos → precauciones experimentales
en relación a la localidad → Aspect, etc. → experimentalmente se violan.
8
0.1.2
El teorema de Kochen-Specker
Las desigualdades de Bell son violadas por predicciones estadı́sticas acerca
de correlaciones y dependen del estado (en el ejemplo, probabilidades de
encontrar las componentes del spin en ciertas direcciones de dos electrones
en estado singlete). Pero hay contradicciones que pueden derivarse usando
sólo el álgebra de los operadores y sin particularizar el estado, entonces:
una demostración algebraica de la contradicción que genera suponer que los
sistemas poseen propiedades.
Sean tres observables A, B y C tales que [A, B] = [A, C] = 0 pero
[B, C] 6= 0. Además, dado un autovector |ϕi común a A y B, es cierto que
vale la consistencia funcional
si A|ϕi = a|ϕi, B|ϕi = b|ϕi → f (A, B)|ϕi = f (a, b)|ϕi
1. No contextualidad: supongo que existen los valores de A. Eso querrı́a
decir que el valor de la propiedad A es independiente de si la determino
sola, junto con B o junto con C (son tres mediciones que se pueden
hacer).
2. Consistencia funcional: puedo afirmar que, sin medir ya que estoy
suponiendo que las propiedades existen, los autovalores de las funciones de observables son las funciones de los autovalores.
La pregunta es: ¿se puede sostener la no-contextualidad de las propiedades
junto con la consistencia funcional para los tres observables A, B, C? La
respuesta es no.
Ejemplo: de nuevo las proyecciones del spin para para dos partı́culas. Se
arman observables del espacio de Hilbert producto tensorial que conmuten
y se les asignan valores posibles.
1 ⊗ σz
σz ⊗ 1
σz ⊗ σz
σx ⊗ 1
1 ⊗ σx
σx ⊗ σx
σx ⊗ σz σz ⊗ σx σy ⊗ σy
Todos tienen autovalores ±1; conmutan entre sı́ en cada fila y en cada
columna; en las filas, el tercero es producto de los dos anteriores; en las
columnas también, aunque en el caso de la tercer columna hay un signo
menos. Entonces, si hago una tabla con los valores posibles salvo para
σy ⊗ σy , todo anda bien. Ahora supongo, por ejemplo, que el valor de σz y
9
el de σx es uno y calculo el valor de σy ⊗σy por el lado de las filas. Obtengo 1
ya que (σx ⊗ σz ) (σz ⊗ σx ) = σy ⊗ σy . Si lo hago por el lado de las columnas,
como (σz ⊗ σz ) (σx ⊗ σx ) = −(σy ⊗ σy ), me da −1, y resulta inconsistente.
En general:
Theorem 0.6 (de Kochen-Specker, 1967) Si dim(H) > 2 es imposible asignar valores numéricos 1 ó 0 a cada proyector
P Pi de tal manera que, si un
conjunto de Pi que conmutan satisfacenP Pi = 1, sus correspondientes
valores v(Pi ), que son 1 ó 0, satisfagan
v(Pi ) = 1.
La necesidad de las álgebras de von Neumann
En el paper que llamaron quantum logic, Birkhoff y von Neumann proponı́an
la estructura que debı́a reemplazar a la de las proposiciones/eventos de la
mecánica clásica. Ahı́ enfatizaban que la lógica cuántica, esa estructura
que ellos llamaron lógica cuántica, tiene la estructura de “una geometrı́a
proyectiva abstracta”, entendiendo por eso un lattice ortocomplementado
modular. Como para el caso de dim = ∞ el lattice no es modular, cosa
que ellos sabı́an, el lattice de Hilbert no es -para ellos- la lógica cuántica.
La razón detrás del requerimiento de modularidad es la necesidad de una
generalización del concepto de probabilidad que fuera adecuada a la mq y a
la vez matemáticamente rigurosa.
Clásicamente la probabilidad puede verse como una medida normalizada
µ sobre el álgebra booleana de los eventos (clásicos), y tiene la propiedad
µ(A) + µ(B) = µ(A ∧ B) + µ(A ∨ B)
que es una de las propiedades que define una función dimensión sobre el
lattice:
Definition 0.7 Un mapa d definido sobre un lattice L y que toma valores
no negativos (tal vez infinitos) se llama dimension function si satisface:
1. d(A) < d(B) si A antecede a B
2. d(A) + d(B) = d(A ∧ B) + d(A ∨ B)
Proposition 0.8 Si existe una función dimensión sobre un lattice L que
toma valores finitos, el lattice es modular.
10
Para caracterizar la probabilidad en el caso en que se haga estadı́stica, von
Neumann considera un ensamble a priori completamente inespecı́fico (fundamentale Gesamtheit, absoluter Gleichgewichtszustand, también “ensamble que corresponde a temperatura infinita”) a partir del cual se seleccionará
el ensamble que tenga las propiedades que dicen cuál es el estado. Cualquier
ensamble se obtiene a partir del inespecı́fico por selección: se arma una subcolección del ensamble original con los elementos que satisfacen una dada
propiedad. Él llama “relativa” a la probabilidad, no porque sea probabilidad condicional, sino porque no necesariamente está normalizada. A la
normalizada la llama “absoluta”.
A partir de los axiomas, de esta forma de armar el ensamble extrayendo
del inespecı́fico los elementos que tienen cierta propiedad y relacionando frecuecias con valores medios, von Neumann llega a que cada ensamble puede
describirse por un operador ρ positivo, no nulo, tipo traza, que sirve para
calcular probabilidades como tr(ρA). En el ensamble a priori están los
sistemas preparados en todos los estados (puros) concebibles con “igual frecuencia relativa” (sus palabras). El ρ de tal cosa es el operador identidad.
En la argumentación utiliza que ρ representa una mezcla estadı́stica y
que describe ensambles preparados en estados puro Pi = |ψi ihψi |,
X
ρ=
λ i Pi
cada uno con peso λi . El peso a priori de cada estado (puro) es 1, que es
igual a la traza (dimensión) del proyector unidimensional que le corresponde.
La argumentación tiene la dificultad de que el operador densidad de la
mezcla inespecı́fica tiene traza infinita. No hay una probabilidad no nula aditiva sobre el conjunto de proyectores sobre H que dé la distribución uniforme
en el “ensamble a priori” y entonces los pesos relativos no pueden ponerse
en correspondencia con frecuencias relativas en el ensamble, que siempre
deben ser ≤ 1. Además, el ensamble contiene una cantidad no numerable de
elementos (las proyecciones unidimensionales sobre H) que también va en
contra de encontrar un sentido a las frecuencias relativas. Y von Neumann
no querı́a dejar de relacionar las probabilidades con frecuencias, para él los
ensambles de la mq son lo que von Mises llama “Kollektive”.
La respuesta de von Neumann a sus problemas es radical: la aparición
de “probabilidades a priori” infinitas (probabilidades que le son necesarias
en su desarrollo) es una patologı́a (en el sentido de una definición rigurosa
de la probabilidad) del espacio de Hilbert. Entonces, por razones fı́sicas, hay
que buscar la definición rigurosa por otro lado, y desarrolla las *-álgebras.
11

Los postulados de la mecánica cuántica

Transcripción

Documentos relacionados

Seminario de Mecánica Cuántica

Teor´ıa de la Información Cuántica