Los postulados de la mecánica cuántica
Transcripción
Los postulados de la mecánica cuántica
Los postulados de la mecánica cuántica Introducción Von Neumann dice en el prefacio de su libro [Mathematical foundations of quantum mechanics, 1932] que su propósito es presentar a la mecánica cuántica en forma matemáticamente rigurosa. Por esto entiende: considerar operadores no acotados, trabajar con los operadores mismos, sin representarlos en coordenadas como matrices, evitar la “ficción” de que todos los operadores autoadjuntos se pueden diagonalizar (usando funciones mal definidas). Para hacerlo, desarrolla la teorı́a de transformaciones basada en la teorı́a de operadores en H. Como la mecánica cuántica es una teorı́a probabilı́stica, tendrá que -por un lado- definir cuáles son los eventos sobre los que predicar probabilidades (relación de las proposiciones/preguntas sı́-no con los proyectores, conectivos entre proposiciones como operaciones entre proyectores) y -por otro- caracterizar esa probabilidad en forma matemáticamente rigurosa y relacionarla con la experiencia fı́sica. Axiomas de la mecánica cuántica vN1 Sistema fı́sico. La interpretación matemática de un sistema cuántico es un espacio de Hilbert complejo separable H. vN2 Estado del sistema. Los estados puros se representan matemáticamente por vectores unitarios |ϕi en H. Los estados que no necesariamente corresponden a información máxima se llaman mezclas. Se repre† sentan P por operatores ρPpositivos tipo traza, ρ = ρ con trρ = 1, ρ = ri |ϕihϕ|, ri > 0, ri = 1. vN3 Eventos. Los eventos relativos al sistema se representan matemáticamente por operadores de proyección P , P 2 = P (correspondientemente subespacios cerrados) sobre H. 1 vN4 Observables. Una cantidad fı́sica u observable, que puede medirse, del sistema está representada por una PVM (projection valued measure) o, equivalentemente, por su operador autoadjunto asociado. Para cualquier operador A asociado a la magnitud A y conjunto de Borel ∆, la interpretación fı́sica de la proyección P (∆) es el evento “el observable representado por A tiene un valor en ∆”. vN5 La probabilidad. La probabilidad p(ρ, P ) de que el sistema que está en el estado ρ satisfaga un evento P está dada por la regla de Born: p(ρ, P ) = tr(ρP ). vN6 Evolución. La evolución espontánea de los estados del sistema está determinada por la ecuación de Schrödinger. Es decir, ∃ U (to , t) U † (to , t) = U −1 (to , t) = U (t, to ), U (to , t) = exp[−ıH(t − to )] tq |ψ(t)i = U (to , t)|ψ(to )i vN7 Postulado de proyección (de von Neumann-Lüders). Para procedimientos de medicióon no destructivos, en el caso de observables discretos y estados puros, “la función de onda colapsa” de la siguiente manera: X X X A= ai Pi = ai |ϕi ihϕi |, |ψi = ci ϕi i si el resultado es aj , |ψi 7→ |ϕj i. Y, en general, si el estado es ρ y el resultado ∆, ρ 7→ P (∆)ρP ∆)/tr(ρP (∆) vN8 Sistemas compuestos. Si H1 y H2 son las representaciones matemáticas de dos sistemas 1 y 2, la representación del sistema compuesto es H1 ⊗ H2 . Comentarios Estados: lo que interesa caracterizar es el ı́nfimo de las propiedades actuales (ı́nfimo en el sentido del lattice de proyectores). A diferencia del caso clásico, en que el estado hace referencia a la posición e impulso de un sistema determinado, el estado cuántico hace referencia al procedimiento de preparación. Por eso se suele definir al estado como la clase de equivalencia de los procedimientos para prepararlo. Un estado |+i no requiere especificación acerca 2 de si se trata de haber preparado electrones, átomos, protones o qué, basta que con ellos se consiga un autovector con autovalores 1/2(1/2 + 1) de S 2 y 1/2 de Sz . Más de los estados: von Neumann se refiere a estados puros (máxima información) y mezclas estadı́sticas (“mezclas propias”, relacionadas con la ignorancia sobre las proporciones de estados puros presentes en el estado). Hay otra clase de estados que no son ni unos ni otros, las “mezclas impropias”, que provienen de trazas parciales y no admiten interpretación por ignorancia. Más de los estados: como la mq es probabilı́stica, dado un estado puro |ψ > y un evento P (proposición experimental desde el punto de vista de la lógica), el estado puede asignar a P valores 0 = f also, 1 = verdadero, o un número en [0, 1] = semánticamente indeterminado. Entonces, por un lado los estados puros representan el máximo admisible de información y por otro esa info es lógicamente incompleta. Eventos: la estructura del conjunto de eventos sobre el que se predicarán probabilidades no es la de un lattice booleano como el de los eventos clásicos sino que es la de un lattice modular para dim finita y ortomodular para dim infinita (orden parcial: inclusión de subespacios, ∧: intersección de subespacios, ∨: el menor subespacio que contiene a la unión, complemento: el complemento ortogonal). El lattice de los subespacios de Hilbert es (teo) atómico, irreducible y satisface la propiedad de cubrimiento. Los átomos son los rayos. (Covering law: dados a, x ∈ L(H), p estado, a < x < a ∨ p ⇒ x = a o x = a ∨ p; modular: si dados x ≤ y, y para todo z se cumple x ∨ (y ∧ z) = y ∧ (x ∨ z) entonces el lattice es modular; si dados x ≤ y, x⊥ ≤ z vale esa igualdad, es ortomodular. Modular ⇒ ortomodular.) Más sobre eventos: hay otra posibilidad además de la descomposición en proyectores queP corresponde a las PVMs. Es la descomposión (redundante) en “efectos” E, Ei = 1, pero E 2 6= E. A la medida que corresponde a esta descomposición se la llama “positive operator valued measure” (POVM) y el álgebra de los eventos E es lamentable, en el sentido de que no cierran las operaciones, hay que completar, y las propiedades satisfacen versiones “débiles” de las usuales, otra biblioteca. Observables: los observables clásicos, como la energı́a o el momento angular, son funciones de las variables canónicas p, q con las que se identifica 3 el estado del sistema (un punto en el espacio de las fases); ası́, el estado del sistema determina los valores de todas las magnitudes. Cuánticamente, los observables se consideran en forma independiente del estado. Los valores posibles son los del espectro. Entonces, la preparación del sistema no determina los valores de las magnitudes, que vienen de otro lado; lo que sı́ determina es la probabilidad de obtener algún valor al medir una magnitud y también el valor medio de las magnitudes. Evolución: hay una evolución para sistemas aislados que es reversible y otra para el proceso de medición, que no lo es. El argumento de von Neumann para el colapso es que, si se mide la energı́a, el resultado debe reobtenerse al volver a medir. Hay otras razones: la de Heisenberg que relaciona al estado del sistema con la información que de él se tiene, entonces el estado después de la medición tiene que dar cuenta (en forma discontinua) de lo nuevo que se sabe por haber medido. Alternativa: considerar el proceso de medición como una interacción con hamiltoniano propio, etc ,→ “problema de la medición”. Más de la evolución: la versión de la ecuación de Schrödinger para estados mezcla es la ecuación de von Neumann: ρ(t) = U (to , t)ρ(to )U (to , t). Si los sistemas compuestos son de indistinguibles, no todos los estados son realizables y hay que agregar el postulado de simetrización. Las probabilidades Los observables están representados por PVMs. El mapa P : B(<) → P(H) que asigna a cada conjunto de Borel sobre < un proyector sobre H es una PVM que satisface P (0) = 0, P (I) = 1, P (< − di ) = I − P (di ) = P ⊥ (di ) X P (∪i di ) = Pi (di ), di disjuntos. Si P es una PVM, µP (ϕ, φ)(d) definida por d 7→ µP (ϕ, φ)(d) = hϕ|P (d)|φi 4 es una medida compleja. Los estados, por su parte, se usan para calcular probabilidades de eventos, es decir, de proyectores. Entonces el estado podrı́a pensarse como un mapa ϕ : P(H) → [0, 1] tq ϕ(0) = 0; ϕ(P ⊥ ) = 1 − ϕ(P ) ϕ(∨Pi ) = X ϕ(Pi ) Pi familia ortogonal, ∨ del lattice de eventos. El mapa ϕ es como una probabilidad. Compuesta con la PVM, µ = ϕ ◦ µP es una medida de probabilidad sobre <: d → Pi → [0, 1] Que existan estados |ϕi o ρ que puedan ponerse en correspondencia con estos mapas ϕ no es algo obvio. El teorema de Gleason asegura que existen: Theorem 0.1 Si dim(H)≥ 3, para cada mapa ϕ existe un operador positivo, autoadjunto tipo traza ρ con tr(ρ) = 1 tq ϕ(P ) = tr(ρP ). Y al revés, cada ρ determina un mapa ϕ que asigna esta probabilidad al evento P . A diferencia del caso clásico en que hay una medida definida por el estado, aquı́ hay muchas (una PVM por cada magnitud fı́sica). Para acotados, tr(ρP ) tiene sentido, y se puede extender de proyectores a operadores: p(P ) = tr(ρP ) → integrando con la µ que por el teorema corresponde a cada ρ → tr(ρA) = hAi Con esto, valores medios, momentos, dispersiones, etc: Z M m (ρA) = (id< )m dµ(ρ, P A ) con µ(ρ, P A )(d) = tr(ρP A (d)) Entonces el valor medio es Z hAiρ = (id)< dµ(ρ, P A ) = tr(ρA) y también se puede calcular la dispersión: σρ2 (A) = hA2 iρ − hAi2ρ 5 Theorem 0.2 (de Heisenberg) Sean A, B, C operadores autoadjuntos sobre H con dominios D(A), D(B), D(C) y sea ϕ el mapa del operador densidad ρ. Sea que: i) ∃D = D(A) ∩ D(B) ∩ D(C) subespacio denso en H ii) tq (AB − BA)|ψi = ı C|ψi, |ψi ∈ D P iii) Si alguno de los operadores es no acotado, ρ = ri |ξi ihξi | con |ξi i ∈ D es de rango finito; si son todos acotados, ρ es arbitrario. Entonces, σA · σB ≥ (1/4)|hCiρ |2 Los operadores acotados para los que vale la igualdad se llaman complementarios. Para dim ∞, Definition 0.3 Dos operadores autoadjuntos A, B sobre un H con dim(H) = ∞ se dicen complementarios uno de otro si tr(P A (E)P B (G)) = 1 µ(E)µ(G) 2π para conjuntos de Borel E, G < ∞, µ la medida de Lebesgue sobre los <. Sean P (no proyector sino el impulso, misma letra!) y Q los observables canónicamente conjugados impulso y posición de una partı́cula libre en una dim. Entonces P , Q son complementarios. 0.1 Las variables ocultas En el ámbito de la mecánica clásica, la versión estadı́stica está vinculada a la imposibilidad material de conocer las condiciones iniciales del gran número de partı́culas que componen al sistema (tı́picamente 1023 para un gas en un recipiente) y de resolver todas sus ecuaciones, en general acopladas, además de la inutilidad de hacerlo. Por eso el problema se trata probabilı́sticamente. Sin embargo, en principio, es posible afirmar que existe un estado que en todo momento está bien definido, aunque no sepamos o no nos interese saber cuál es. Un tal estado es un punto en el espacio de las fases, que evoluciona determinı́sticamente. Puntos ası́ pueden identificarse con las medidas de Dirac concentradas en los puntos. Las medidas de Dirac son los estados sin dispersión de la mecánica estadı́stica clásica. Mientras preparaba su libro, von Neumann estaba estudiando problemas de mecánica estadı́stica clásica: los tres paper de cuántica son de 1927 (el que es con Hilbert y Nordheim y 6 los dos solo), el libro es de 1932 y en el medio publicó su prueba del teorema ergódico, y del teorema H (1929) y, en 1932, la prueba del quasiergódico y tres papers más de mecánica estadı́stica. En el libro demuestra que el caso cuántico es otra historia: Definition 0.4 Si σρ (A) = 0 para todo A, entonces ρ se dice sin dispersión (dispersion free) Proposition 0.5 (de von Neumann) Si dim(H) > 2, no existen estados sin dispersión. La demostraciôn de von Neumann es controvertida pero lo importante es que su idea era mostrar la imposibilidad de interpretar las probabilidades cuánticas en términos de ignorancia. Después viene mucho trabajo en el tema: las demostraciones de Bell del 64 y 66, el experimento de Aspect y compañı́a del 81, la demostración de Jauch y Piron del 63 en términos de lattices, la de Misra del 67 en la formulación algebraica, ... 0.1.1 Bell à la Wigner Sea un par de indistinguibles de spin 1/2 (por ejemplo, electrones) en estado singlete 1 √ [| + −i − | − +i] 2 {|+i, |−i} la base en que diagonaliza σz , [σx , σy ] = ı σz y cı́clicas σς |±i = ±|±i en toda dirección ς (siempre ~ = 1). Sean dos direcciones 1, 2 formando ángulo α12 en las que → quiero referirme a las componentes de − σ . Las probabilidades predichas por la teorı́a de obtener, al medir, los cuatro diferentes resultados posibles son: p++ = p−− = 1 α12 1 α12 sin2 ; p+− = p−+ = cos2 2 2 2 2 Sea que, aunque no pueda determinarlas simultáneamente, las componentes del spin existan. Entonces, se trata de ver cómo asignarles valores. Notación: con (+ − +; − − +) se indica la probabilidad de una partı́cula tenga componentes del spin + en dirección 1, − en 2, + en 3 y la otra − en 1 y 2, + en 3. Son dos partı́culas, tres componentes del spin, dos autovalores 7 cada componente, entonces hay 26 = 64 de estos paréntesis. Casi todos son cero por la condición de indistinguibles, quedan ocho que se agrupan de a dos de nuevo por la indistinguibilidad: (+ + +; − − −) = (− − −; + + +) (+ + −; − − +) = (− − +; + + −) (+ − −; − + +) = (− + +; + − −) (− + −; + − +) = (+ − +; − + −) Si las componentes del spin son propiedades que las partı́culas tienen, ¿cuál es la probabiidad escrita en términos de estos paréntesis, que son los que dan cuenta de ello, de que una tenga componente + en dirección 1 y la otra + en dirección 2? Es: p1+2+ = (+ − +; − + −) + (− + −; + − +) El formalismo predice que vale p1+2+ = 1 α12 sin2 2 2 Puedo repetir esto para p2+3+ = 1 α23 1 α13 sin2 y para p1+3+ = sin2 2 2 2 2 Ahora calculo sin2 α12 α23 + sin2 2 2 en términos de los paréntesis: α12 α23 + sin2 = 2(+ − +; − + −) + 2(+ − −; − + +) + 2(+ + −; − − +)+ 2 2 α13 +2(− + −; + − +) = 2(+ − +; − + −) + 2(− + −; + − +) + sin2 2 Como los paréntesis son probabilidades multiplicadas por dos, son ≥ 0, entonces, desigualdades de Bell: sin2 sin2 α12 α23 α13 sin2 ≥ sin2 2 2 2 Para el caso α12 = α23 = π/3 y α13 = 2π/3, la desigualdad se viola. Es que usando que las propiedades existen independientemente de todo, se está sumando probabilidades y no amplitudes de probabilidad. Es posible testear experimentalmente → varios intentos → precauciones experimentales en relación a la localidad → Aspect, etc. → experimentalmente se violan. 8 0.1.2 El teorema de Kochen-Specker Las desigualdades de Bell son violadas por predicciones estadı́sticas acerca de correlaciones y dependen del estado (en el ejemplo, probabilidades de encontrar las componentes del spin en ciertas direcciones de dos electrones en estado singlete). Pero hay contradicciones que pueden derivarse usando sólo el álgebra de los operadores y sin particularizar el estado, entonces: una demostración algebraica de la contradicción que genera suponer que los sistemas poseen propiedades. Sean tres observables A, B y C tales que [A, B] = [A, C] = 0 pero [B, C] 6= 0. Además, dado un autovector |ϕi común a A y B, es cierto que vale la consistencia funcional si A|ϕi = a|ϕi, B|ϕi = b|ϕi → f (A, B)|ϕi = f (a, b)|ϕi 1. No contextualidad: supongo que existen los valores de A. Eso querrı́a decir que el valor de la propiedad A es independiente de si la determino sola, junto con B o junto con C (son tres mediciones que se pueden hacer). 2. Consistencia funcional: puedo afirmar que, sin medir ya que estoy suponiendo que las propiedades existen, los autovalores de las funciones de observables son las funciones de los autovalores. La pregunta es: ¿se puede sostener la no-contextualidad de las propiedades junto con la consistencia funcional para los tres observables A, B, C? La respuesta es no. Ejemplo: de nuevo las proyecciones del spin para para dos partı́culas. Se arman observables del espacio de Hilbert producto tensorial que conmuten y se les asignan valores posibles. 1 ⊗ σz σz ⊗ 1 σz ⊗ σz σx ⊗ 1 1 ⊗ σx σx ⊗ σx σx ⊗ σz σz ⊗ σx σy ⊗ σy Todos tienen autovalores ±1; conmutan entre sı́ en cada fila y en cada columna; en las filas, el tercero es producto de los dos anteriores; en las columnas también, aunque en el caso de la tercer columna hay un signo menos. Entonces, si hago una tabla con los valores posibles salvo para σy ⊗ σy , todo anda bien. Ahora supongo, por ejemplo, que el valor de σz y 9 el de σx es uno y calculo el valor de σy ⊗σy por el lado de las filas. Obtengo 1 ya que (σx ⊗ σz ) (σz ⊗ σx ) = σy ⊗ σy . Si lo hago por el lado de las columnas, como (σz ⊗ σz ) (σx ⊗ σx ) = −(σy ⊗ σy ), me da −1, y resulta inconsistente. En general: Theorem 0.6 (de Kochen-Specker, 1967) Si dim(H) > 2 es imposible asignar valores numéricos 1 ó 0 a cada proyector P Pi de tal manera que, si un conjunto de Pi que conmutan satisfacenP Pi = 1, sus correspondientes valores v(Pi ), que son 1 ó 0, satisfagan v(Pi ) = 1. La necesidad de las álgebras de von Neumann En el paper que llamaron quantum logic, Birkhoff y von Neumann proponı́an la estructura que debı́a reemplazar a la de las proposiciones/eventos de la mecánica clásica. Ahı́ enfatizaban que la lógica cuántica, esa estructura que ellos llamaron lógica cuántica, tiene la estructura de “una geometrı́a proyectiva abstracta”, entendiendo por eso un lattice ortocomplementado modular. Como para el caso de dim = ∞ el lattice no es modular, cosa que ellos sabı́an, el lattice de Hilbert no es -para ellos- la lógica cuántica. La razón detrás del requerimiento de modularidad es la necesidad de una generalización del concepto de probabilidad que fuera adecuada a la mq y a la vez matemáticamente rigurosa. Clásicamente la probabilidad puede verse como una medida normalizada µ sobre el álgebra booleana de los eventos (clásicos), y tiene la propiedad µ(A) + µ(B) = µ(A ∧ B) + µ(A ∨ B) que es una de las propiedades que define una función dimensión sobre el lattice: Definition 0.7 Un mapa d definido sobre un lattice L y que toma valores no negativos (tal vez infinitos) se llama dimension function si satisface: 1. d(A) < d(B) si A antecede a B 2. d(A) + d(B) = d(A ∧ B) + d(A ∨ B) Proposition 0.8 Si existe una función dimensión sobre un lattice L que toma valores finitos, el lattice es modular. 10 Para caracterizar la probabilidad en el caso en que se haga estadı́stica, von Neumann considera un ensamble a priori completamente inespecı́fico (fundamentale Gesamtheit, absoluter Gleichgewichtszustand, también “ensamble que corresponde a temperatura infinita”) a partir del cual se seleccionará el ensamble que tenga las propiedades que dicen cuál es el estado. Cualquier ensamble se obtiene a partir del inespecı́fico por selección: se arma una subcolección del ensamble original con los elementos que satisfacen una dada propiedad. Él llama “relativa” a la probabilidad, no porque sea probabilidad condicional, sino porque no necesariamente está normalizada. A la normalizada la llama “absoluta”. A partir de los axiomas, de esta forma de armar el ensamble extrayendo del inespecı́fico los elementos que tienen cierta propiedad y relacionando frecuecias con valores medios, von Neumann llega a que cada ensamble puede describirse por un operador ρ positivo, no nulo, tipo traza, que sirve para calcular probabilidades como tr(ρA). En el ensamble a priori están los sistemas preparados en todos los estados (puros) concebibles con “igual frecuencia relativa” (sus palabras). El ρ de tal cosa es el operador identidad. En la argumentación utiliza que ρ representa una mezcla estadı́stica y que describe ensambles preparados en estados puro Pi = |ψi ihψi |, X ρ= λ i Pi cada uno con peso λi . El peso a priori de cada estado (puro) es 1, que es igual a la traza (dimensión) del proyector unidimensional que le corresponde. La argumentación tiene la dificultad de que el operador densidad de la mezcla inespecı́fica tiene traza infinita. No hay una probabilidad no nula aditiva sobre el conjunto de proyectores sobre H que dé la distribución uniforme en el “ensamble a priori” y entonces los pesos relativos no pueden ponerse en correspondencia con frecuencias relativas en el ensamble, que siempre deben ser ≤ 1. Además, el ensamble contiene una cantidad no numerable de elementos (las proyecciones unidimensionales sobre H) que también va en contra de encontrar un sentido a las frecuencias relativas. Y von Neumann no querı́a dejar de relacionar las probabilidades con frecuencias, para él los ensambles de la mq son lo que von Mises llama “Kollektive”. La respuesta de von Neumann a sus problemas es radical: la aparición de “probabilidades a priori” infinitas (probabilidades que le son necesarias en su desarrollo) es una patologı́a (en el sentido de una definición rigurosa de la probabilidad) del espacio de Hilbert. Entonces, por razones fı́sicas, hay que buscar la definición rigurosa por otro lado, y desarrolla las *-álgebras. 11