¿Cómo debo visualizar las cantidades de tensor?

Imagine un disco circular hecho de un material flexible como se muestra a continuación. Supongamos que este disco se estira en una dirección y se comprime en otra (se muestra con líneas de puntos) sin retorcerse, convirtiendo así el círculo en una elipse. Además, digamos que el disco distorsionado se gira con un ángulo en su plano para producir el estado final, “transformado”.

Aquí está la tarea: se le da la tarea de “expresar cuantitativamente” lo que le ha ocurrido al disco. Intentemos hacer esto usando nuestras nociones habituales de escalares y vectores:

  • Podemos especificar la distorsión, es decir, por cuánto se ha contraído el disco (cantidad escalar) y en qué dirección (s) (cantidad vectorial). Este método implica especificar dos relaciones de estiramiento y dos direcciones.
  • Podemos especificar el ángulo de rotación (cantidad escalar), pero eso no contiene información sobre la distorsión.
  • Una tercera forma, más general, sería relacionar la ecuación del círculo inicial con la elipse transformada. Este enfoque contendrá toda la información que necesitamos representar y es una forma válida de capturar tanto el estiramiento / encogimiento como la rotación . Sin embargo, esto no proporciona una manera de asignar los puntos dentro del círculo a los puntos dentro de la elipse.

Resulta que tenemos una forma mejor, más inteligente. Tomamos un vector que conecta dos puntos dentro del círculo y vemos cómo ese vector cambia cuando el círculo se convierte en una elipse. Físicamente, esto es análogo a martillar dos clavos en diferentes puntos del disco en el estado inicial, estirando una banda elástica entre esos clavos, luego “transformando” el disco al estado final y observando lo que le sucede a la banda elástica. Como se muestra en el diagrama a continuación, estamos buscando una ‘función’ matemática que convierte vector [math] \ mathbf {X} [/ math] en el estado inicial a vector [math] \ mathbf {x} [/ math] en el estado final

Una pregunta natural es: ¿a qué se debe parecer esta “función” de mapeo (digamos [math] M [/ math])? ¿Es un escalar, un vector o algo completamente diferente? Lo menos que sabemos es que [math] M [/ math] no puede ser un escalar, ya que un escalar solo estira un vector y aquí el vector [math] \ mathbf {X} [/ math] se está estirando y rotando. Por lo tanto, necesitamos expresar matemáticamente el proceso de estirar y rotar simultáneamente un vector.

En este punto, te obligo a recordar una parte de las matemáticas aparentemente no relacionadas . Multiplicación de matrices . Recordar que

  1. Una matriz de 2 × 2 se multiplicará con una matriz de 2 × 1 para producir otra matriz de 2 × 1.
  2. Las matrices tienen valores propios y vectores propios. Si una matriz 2 × 2 [math] \ mathbf {M} [/ math] tiene un vector propio [math] \ mathbf {v} [/ math], entonces [math] \ mathbf {Mv} = \ lambda \ mathbf {v }[/mates]. (Muy bien, tal vez no recuerdes esto, pero son importantes para el concepto de tensor).

Con esta información, mire hacia atrás al estado transformado y observe dos cosas:

  1. Tanto [math] \ mathbf {X} [/ math] como [math] \ mathbf {x} [/ math] se pueden escribir como vectores 2 × 1 o matrices de columna (básicamente estoy eliminando la notación i, j más familiar , en lugar de escribir solo los componentes).
  2. Hay una matriz 2 × 2 [math] \ mathbf {M} [/ math] que cuando se multiplica con [math] \ mathbf {X} [/ math], da [math] \ mathbf {x} [/ math]. ¿Qué hace [math] \ mathbf {M} [/ math] a otros vectores? Habrá ciertos vectores (los vectores propios de [math] \ mathbf {M} [/ math]) que no se rotarán, solo se estirarán con esta multiplicación, pero en general, cualquier vector se estirará y rotará (como [math ] \ mathbf {X} [/ math] fue).

Por lo tanto, [math] \ mathbf {x} = \ mathbf {MX} [/ math] satisface todos los requisitos de la función que nos propusimos describir, es decir, captura el estiramiento (es) y la rotación, en una sola matriz . Ahora solo tenemos que seleccionar los 4 componentes de [math] \ mathbf {M} [/ math] para que [math] \ mathbf {M} [/ math] se aplique a este ejemplo específico, es decir, cuando se aplique en vector [math ] \ mathbf {X} [/ math], produce el vector [math] \ mathbf {x} [/ math].

[math] \ mathbf {M} [/ math] es la función que buscábamos: convierte un vector en otro vector. Los valores propios de [math] \ mathbf {M} [/ math], son las relaciones de estiramiento a lo largo de las direcciones de puntos en nuestro ejemplo y los vectores propios son las direcciones en sí mismas. Como conocemos los vectores propios, también conocemos el ángulo de rotación entre los estados inicial y final.

Si aún no lo has adivinado, la matriz [math] \ mathbf {M} [/ math] es el tensor. Para el resto de esta respuesta, “matriz” y “tensor” se usan indistintamente.

La idea de que los tensores de conversión de vectores a otros vectores se puede llevar a dimensiones superiores:

  • Un vector 3-D (3 × 1) puede transformarse en otro vector 3D mediante un tensor 3 × 3.
  • un tensor 3 × 3 se puede transformar en otro tensor 3 × 3 mediante un tensor 3x3x3x3.

¿Por qué necesitamos tensores? Bueno, la física tiene varios casos de objetos girando, distorsionando, o comprimiendo / expandiendo. Estos objetos podrían ser cosas tangibles, como sólidos o líquidos, o cosas relativamente abstractas como el espacio mismo. Todas estas relaciones de vector a vector o de tensor a tensor se manejan mediante la introducción de tensores más y más complicados a lo largo de la plantilla [math] \ mathbf {x} = \ mathbf {MX} [/ math]. De hecho, los escalares y los vectores son tipos de tensores también.

En términos de visualización, un tensor M es simplemente una matriz que convierte el vector A en el vector B. El ejemplo dado puede ayudar a entender lo que HACE un tensor : implementa estiramientos y rotaciones en vectores en el espacio. Desafortunadamente, no hay una visualización más simple, “Hey, aquí hay una cabeza de flecha” de un tensor.

Para concluir, aquí hay dos exenciones de responsabilidad con respecto a esta explicación:

  1. No vincule un tensor necesariamente a una transformación física. El ejemplo proporcionado es meramente ilustrativo. Un tensor podría vincular, por ejemplo, dos vectores de fuerza (un tensor de tensión / presión), o dos vectores de velocidad (un tensor de gradiente de velocidad), o un tensor de tensión y tensión (el módulo elástico: una bestia 3x3x3x3 con 81 componentes).
  2. El tratamiento más general y técnicamente consistente de los tensores se encuentra en la respuesta de Arpan Saha a esta pregunta. Mi respuesta es simplemente una introducción a un cierto tipo de tensor que parece comparativamente menos atemorizante para los principiantes.

Comencemos con uno de los tipos de objetos tensoriales más simples que se pueden definir en espacios vectoriales de dimensión finita: mapas lineales de espacios vectoriales a espacios vectoriales. Digamos que sus respectivas dimensiones son [math] m [/ math] y [math] n [/ math]. Dado que todos los espacios vectoriales de una cierta dimensión son, en cierto sentido, lo mismo, basta con imaginar que todo se está reproduciendo en los ejemplos prototípicos de espacios vectoriales, [math] \ mathbb R ^ m [/ math] y [math ] \ mathbb R ^ n [/ math].

Los mapas lineales se llaman ‘lineales’ por una razón: asignan ‘líneas’ en [math] \ mathbb R ^ m [/ math] a ‘lines’ en [math] \ mathbb R ^ n [/ math]. Entonces, si imaginas que tu espacio vectorial [math] \ mathbb R ^ m [/ math] esté entrecruzado por un andamio de tubos paralelos, cuál es tu mapa lineal, también conocido como tensor de rango [math] (1,1) [/ math] La matriz alias esencialmente hace apretar / rotar / estirar estos tubos sin doblarlos, y luego incrustar toda la configuración en el espacio [math] \ mathbb R ^ n [/ math].

¿Qué representan todas las entradas en la matriz? Considera los vectores [math] (1,0,0 \ ldots) [/ math], [math] (0,1,0 \ ldots) [/ math] y así sucesivamente en [math] \ mathbb R ^ m [ / math] (esta es solo una opción estándar; puedes elegir cualquier base que desees) y ver en qué se convierten estos vectores [math] m [/ math] bajo el mapa lineal representado por la matriz en cuestión. Al final, tiene vectores [math] m [/ math] en [math] \ mathbb R ^ n [/ math], que pueden escribirse como columnas [math] m [/ math] con [math] n [ / math] entradas cada uno. Cuando coloca estas columnas lado a lado, recupera la matriz con la que comenzó. Cualquier mapa lineal [math] T [/ math] entre cualquier par de espacios vectoriales puede, por lo tanto, representarse como una matriz, pero las entradas son sensibles a la elección de la base.

Ejemplo ilustrativo : los vectores de base son las matrices de columna [math] (1 \ quad 0) ^ t [/ math] y [math] (0 \ quad 1) ^ t [/ math]. Cualquier vector [math] (x \ quad y) ^ t [/ math] puede escribirse como [math] x \, (1 \ quad 0) ^ t + y \, (0 \ quad 1) ^ t [/ math ]. Ahora, digamos que tiene un mapa lineal [math] T [/ math] tal que [math] T ((1 \ quad 0) ^ t) = (a \ quad c) ^ t [/ math] y [math] T ((0 \ quad 1) ^ t) = (b \ quad d) ^ t [/ math]. Entonces, debido a la linealidad de [math] T [/ math]

[math] T ((x \ quad y) ^ t) = x \, T ((1 \ quad 0) ^ t) + y \, T ((0 \ quad 1) ^ t) [/ math]
[math] = x \, (a \ quad c) ^ t + y \, (b \ quad d) ^ t [/ math]

Esto es exactamente lo que sucede cuando se lleva a cabo la multiplicación de matrices.


Los tensores generales requieren un ingrediente más: la noción de un producto tensorial de dos espacios vectoriales [math] V [/ math] y [math] W [/ math]. La idea es elegir una base [math] v_i [/ ​​math] en [math] V [/ math] y [math] w_i [/ ​​math] en [math] W [/ math], y luego construir un nuevo espacio vectorial [math] V \ otimes W [/ math] fuera de las combinaciones lineales formales de los pares ordenados [math] (v_i, w_j): = v_i \ otimes w_j [/ math]. Se dice que el nuevo espacio vectorial es el producto tensorial de [math] V [/ math] y [math] W [/ math] y tiene sentido como una construcción porque existe una forma muy natural de identificar todos los posibles productos tensoriales de los espacios vectoriales que obtenemos para diferentes elecciones de base: simplemente asegúrese de que la operación [math] \ otimes [/ math] en los vectores se distribuya sobre las sumas y sea equivalente con respecto a la multiplicación por escalas (debemos especificar el campo [math] \ mathbb F [/ math] de los escalares sobre los cuales se toma el producto tensorial, por esta razón a veces usamos el símbolo [math] \ otimes_ \ mathbb F [/ math] para hacer explícita la dependencia del producto tensorial en el campo básico ).

Nota 1 : Este tipo de construcción surge muy naturalmente en la mecánica cuántica. Digamos que un electrón puede estar en un estado superior [math] | \ uparrow \ rangle [/ math] o un estado inferior [math] | \ downarrow \ rangle [/ math], o una combinación lineal de estos dos estados. Luego, los dos electrones de los estados, etiquetados como [math] a [/ math] y [math] b [/ math], pueden ocupar [math] | \ uparrow \ rangle_a \ otimes | \ uparrow \ rangle_b [/ math], [math] | \ downarrow \ rangle_a \ otimes | \ uparrow \ rangle_b [/ math], [math] | \ uparrow \ rangle_a \ otimes | \ downarrow \ rangle_b [/ math], [math] | \ downarrow \ rangle_a \ otimes | \ downarrow \ rangle_b [/ math] y todas sus combinaciones lineales sobre [math] \ mathbb C [/ math]. Así, el espacio de estados físicos de dos electrones es solo el producto tensorial del espacio de estados físicos de los electrones individuales.

Un tensor de valencia [math] (p, q) [/ math] en un espacio vectorial [math] V [/ math] es solo un mapa lineal del producto tensorial de [math] q [/ math] copias de [ math] V [/ math], denotado como [math] V ^ {\ otimes q} [/ math], a [math] V ^ {\ otimes p} [/ math].

Nota 2 : Es convencional dejar que [math] V ^ {\ otimes 0} [/ math] sea el campo básico [math] \ mathbb F [/ math]. Dado que cualquier mapa lineal desde [math] \ mathbb F [/ math] a [math] V [/ math] se arregla completamente al especificar a qué vector [math] 1 [/ math] se asigna, podemos identificar el espacio de todos tales mapas con [math] V [/ math] en sí. Por lo tanto, a menudo se dice que los vectores pueden considerarse como tensores de valencia [math] (1,0) [/ math].

Nota 3 : Hay una forma más general de ver los productos de tensor que también tiene sentido en el contexto de los módulos. Los módulos son como espacios vectoriales, excepto que los escalares distintos de cero pueden no tener inversos multiplicativos. En otras palabras, mientras que los espacios vectoriales se definen sobre un campo , los módulos se definen sobre un anillo . El ejemplo prototípico de un módulo es el espacio de campos vectoriales en alguna variedad suave con los escalares siendo funciones suaves en la variedad. Podemos ver que, en general, puede que no exista una base (la prueba de su existencia se basa en la existencia de los inversos multiplicativos para todos los escalares distintos de cero), por lo que se define el producto tensorial de dos módulos utilizando elementos de sus (posiblemente no existentes). ) Las bases no son la mejor manera de hacer las cosas. En cambio, supongamos que nos dan dos módulos [math] V [/ math] y [math] W [/ math] sobre un anillo [math] R [/ math], el producto tensorial [math] V \ otimes_R W [/ math] se define como un [math] R [/ math] -module [math] U [/ math], junto con [math] R [/ math] -bilinear map [math] f: V \ times W \ rightarrow U [/ math], de modo que para cualquier [math] R [/ math] -bilinear map [math] g: V \ times W \ rightarrow X [/ math], existe un único [math] R [/ math ] mapa lineal [math] h: U \ rightarrow X [/ math] que satisface [math] h \ circ f = g [/ math]. Esta definición corrige [math] U [/ math] hasta un [math] R [/ math] canónico – isomorfismo lineal (dejado como ejercicio!). Para demostrar la equivalencia de esta definición del tensor con la que presenté anteriormente en el caso donde [math] V [/ math] y [math] W [/ math] son ​​espacios vectoriales equipados con bases [math] \ {v_i \ } [/ math] y [math] \ {w_i \} [/ math] respectivamente, simplemente tenemos que mostrar que [math] f (v_i, w_j) [/ math] forman una base para [math] U [/ math ]. La existencia del mapa [math] h [/ math] para cualquier [math] X [/ math] arbitrario garantiza que los vectores [math] f (v_i, w_j) [/ math] sean linealmente independientes (solo deje [math] X [/ math] sea [math] V \ otimes W [/ math] según la definición anterior y argumenta que los vectores linealmente dependientes no se pueden mapear a vectores linealmente independientes mediante [math] h [/ math]). La singularidad de [math] h [/ math] mientras tanto garantiza que los vectores [math] f (v_i, w_j) [/ math] abarcan [math] U [/ math] (o bien, los vectores que no se encuentran en el subespacio que abarca) lo mismo se puede asignar a [math] X [/ math] de manera arbitraria).

Imagina un velero.

Si el velero es empujado por un viento, la fuerza producida por el viento será aproximadamente proporcional al viento, pero irá en una dirección diferente a la del viento.

La regla que va desde la dirección / velocidad del viento -> fuerza en la vela es un mapeo lineal (es decir, un tensor).