Государственный Астрономический Институт
им.
П.К.Штернберга, Москва.
Рецензенты: др. физ. мат. наук
В.Е.Жаров,
др. физ. мат. наук К.В. Куимов.
Этот курс лекций читался студентам кафедры небесной механики, астрометрии и гравиметрии в Государственном астрономическом институте им. П. К. Штернберга Московского государственного университета. Специальная теория относительности (СТО) давно стала рабочим инструментом физики и астрономии. В частности, СТО используется для вычисления параметров ускорителей элементарных частиц, т.е. для физики СТО давно является теорией - инструментом аналогично теории электродинамики Максвелла и Лоренца. Как следствие, внедрение СТО в инженерные расчеты потребовало включение этого курса в число обязательных курсов для студентов физических специальностей. Курс по специальной теории относительности входит как часть в современную электродинамику и в Московском государственном университете преподаются как обязательный курс.
Общая теория относительности (ОТО) была востребована современной технологией сравнительно недавно, два десятилетия назад в высокоточной позиционной астрономии. Сейчас ОТО в приближении слабого гравитационного поля используется в высокоточной навигации (система космической навигации GPS, ГЛОНАСС). Формулы для редукции за эффекты ОТО приводятся во всех астрономических справочниках.
Однако в преподавании СТО и ОТО наблюдается некоторый пробел. Курсы, посвященные общей теории относительности, читаются студентам, желающим специализироваться по релятивистской астрофизике или космологии. Специального курса для студентов специализирующихся по астрометрии и небесной механике до сих пор не было.
Потребность учета эффектов специальной и общей теории относительности возникла, когда точность рядовых измерений стала превышать 1 секунду дуги. Современная точность измерений в астрометрии составляет доли миллисекунды дуги, поэтому требуется учет поправок специальной и общей теории относительности. Следовательно астрометристам такой курс совершенно необходим.
К началу 90 годов точность позиционных измерений значительно выросла в радиодиапазоне и в оптическом диапазоне. В радиодиапазоне рост точности угломерных измерений связан, прежде всего, с успехами радиоинтерферометров со сверхдлинными базами (РСДБ). Сейчас точность угломерных измерений в международной сети РСДБ равняется 0.25 миллисекунды дуги (mas), составляя для некоторого числа особо стабильных источников десятки микросекунд () дуги. Успехи в области оптической астрономии связаны, в основном, с экспериментом "HIPPARCOS". При проведении этого эксперимента достигнута точность несколько миллисекунд дуги для более чем 100 000 звезд по обеим координатам , .
Точность в 1 mas предполагает учет поправок общей теории относительности на уровне порядка . Эффекты ОТО, которые необходимо учитывать при редукции астрономических наблюдений, включают в себя эффекты т.н. первого постньютоновского порядка в солнечной системе. Переход к точности потребует более тщательной редукции, а следовательно учет более высоких членов по степеням отношения характерной скорости к скорости света (основной малый параметр при постньютоновских вычислениях).
Успех эксперимента HIPPARCOS породил новые астрометрические проекты GAIA, SIM, FAME, DIVA, DARWIN и т.п. Одна из научных целей таких проектов - составить новые каталоги звезд объемом вплоть до миллиарда звезд и точностью измерений координат вплоть до 10 - 1 . Наличие таких каталогов будет значительно облегчать задачи астрономов других специальностей.
В России также существуют космические проекты, часть научных целей которых составляют высокоточные угломерные измерения. В частности, необходимо упомянуть радиоинтерферометр на орбите, что позволит значительно повысить точность измерений в радиодиапазоне, а также проект "ЛОМОНОСОВ", предполагающий измерения в оптическом дииапазоне.
Необходимость редукции за эффекты общей теории относительности - естественное требование космических экспериментов 21 века по астрометрии. Точность этих экспериментов будет уже такая, что они будут иметь смысл только при учете эффектов СТО и ОТО. Эффекты, связанные с кривизной пространства - времени в нашей солнечной системе, а также с нестационарной кривизной пространства - времени в нашей Галактике, будут основными эффектами, которые определяют точность измерений в будущих экспериментах.
В стандартных учебниках по СТО и ОТО мало уделяется внимания чисто астрономическим аспектам специальной и общей теории относительности. Все перечисленное выше, вызвало необходимость читать новый курс, посвященный теории относительности для астрономов.
Надо отметить, что по теории относительности существует большое количество прекрасных учебников. Не перечисляя все, упомянем два основных. Это прежде всего том II курса Л.Д.Ландау, Е.М,Лифшица, озаглавленный "Теория поля", а также книга С. Вайнберга "Гравитация и относительность". Методика преподавания теории относительности сейчас достаточно сильно зависит от того, студентам какой физической специальности читается соответствующий курс. Данный курс построен так, что изложение основных идей СТО и ОТО следует во многом историческому пути, который прошел сам А.Эйнштейн. Автор лекций постарался собрать воедино лучшие объяснения основных идей, которые лежат в основе теории относительности. В лекциях также уделено достаточно много внимания примерам, на которых демонстрируется применение идей и методов теории относительности.
Остается только добавить, что написание и издание этого материала стало возможным только благодаря поддержке грантов РФФИ N 00 - 02 - 16350. Автор также благодарен за большую работу, взятую на себя докт. физ.-мат. наук В.Е.Жаровым и докт. физ.-мат. наук К.В. Куимовым, которая заключалась в редактировании текста и исправлении ошибок, ответственность за наличие которых лежит целиком на авторе. Автор благодарен также общему редактору И.А.Герасимову, благодаря которому стало возможно издание этой книги.
Первый принцип относительности (ПО) был сформулирован еще в эпоху Возрождения Г.Галилеем. ПО относился к механике и гласил: "Законы механики в системе координат, движущейся равномерно и прямолинейно в пространстве, имеют тот же вид, что и в системе координат, покоящейся в пространстве".
Из этого постулата можно сделать простой вывод, а именно: существует бесконечно много эквивалентных систем координат, называемых инерциальными и совершающими равномерное и прямолинейное движение или покоящихся друг относительно друга. В этих системах законы механики выполняются в простой классической форме.
Определим сразу, что законами механики здесь будем называть законы движения в классической механике и законы сохранения.
Принцип относительности Галилея на математическим языке преобразования координат обычно формулируется следущим образом. Пусть положение пробной частицы описывается в декартовой системе координат , кроме трех пространственных координат мы добавили временную координату, которая необходима в специальной теории относительности (СТО) и общей теории относительности (ОТО), . В системе координат = , , , , законы механики остаются неизменными, если система движется относительно системы координат со скоростью , так, что две системы координат связаны между собой преобразованием Галилея:
(1.1) | |||
В частности из принципа относительности Галилея вытекал закон
сложения скоростей:
(1.2) |
Законы механики остаются неизменными также в системах координат, оси которых повернуты друг относительно друга. Поскольку астрономы - наблюдатели с преобразованиями типа поворота имеют дело повседневно, обсудим их более подробно.
На языке математики преобразования Галилея называются преобразованиями трехмерной системы координат. Преобразования типа (1.1) называются преобразованием сдвига. Помимо сдвига в трехмерном пространстве также часто используют преобразование вращения.
Рассмотрим все вращения трехмерного пространства вокруг одной
фиксированной точки - начала координат. В ортогональной системе
координат трехмерного пространства вращение задается уравнением
(1.3) |
Кроме того, при вращении остается инвариантной форма вида:
Поэтому можно получить уравнение для коэффицентов матрицы вида:
(1.4) |
Матрицы удовлетворяющие уравнению (1.4)
называются ортогональными матрицами. Если вычислить
детерминант обеих частей уравнения (1.4),
то получим условие вида , что дает два возможных знака
детерминанта:
Рассмотрим вращения.
Прежде всего проанализируем две системы координат на плоскости.
Одну систему координат будем обозначать , вторую - . Будем считать, что центры этих
систем совпадают, а оси повернуты друг относительно друга на угол
против часовой стрелки. Тогда
преобразования от координат без крышечки к координатам с крышечкой
записываются в виде системы линейных уравнений:
Представим это преобразование в матричном виде. Как видно из предыдущей системы уравнений, вращения совершаются вокруг некоторой оси. Для начала выберем в качестве оси вращения ось и совершим вращение на угол . Матрица этого вращения имеет вид:
Математики характеризуют вращение как некоторый вектор,
направленный вдоль оси вращения и равный по величине углу поворота.
Для астрономов более привычным является представление вращения в
виде трех последовательных положительных вращений на углы Эйлера
Полное вращение может быть представлено трех вращений. Первое -
вращение
(1.5) |
Элементы полной матрицы вращения можно найти как произведение трех
матриц поворотов вокруг осей , , :
(1.6) |
(1.7) |
(1.8) |
При перемножении матриц необходимо помнить, что они перемножаются в обратном порядке. Перемножив матрицы, получим:
(1.9) | |||
Вращение (1.9) имеет обратный элемент. Обратный элемент - это вращение на такие углы, которые приводят систему координат в прежнее положение. Он задается другим вращением, которое совершается на углы Эйлера , , .
Остается только добавить, что вращения образуют группу. Элементами группы являются повороты на углы Эйлера. Группа топологически эквивалентна шару, у которого отождествлены диаметрально противоположные точки.
В качестве примера приведем матрицу преобразования от координат небесных тел, заданных в каталогах к текущим координатам на данный момент наблюдений.
В каталогах обычно приводятся несколько характеристик некоторой
звезды, две из которых - координаты звезды (ее положение) на
небесной сфере (прямое восхождение) и (склонение) приведенные на
определенную эпоху. Другими словами, указывается положение звезды на
определенный момент времени, скажем, на 1 января 2000 года. Кроме
указания эпохи, необходимо определить саму систему координат и
указать начало отсчета координат
Полюс мира - точка, на которую опирается полярная ось, вокруг
которой вращается Земля - естественная ось для системы координат.
Звезды в течении ночи меняют свое положение на небе (факт известный
каждому, кто хоть раз наблюдал за ночным небом), лишь обна точка
остается неподвижной - полюс мира. Наиболее близко к полюсу (но не
точно в полюсе) находится Полярная звезда. Формально полярная ось
определяется как ось, проведенная через центр системы координат,
параллельная оси вращения Земли [
В астрономии исторически выбирана сферическая система координат связанная с вращением Земли. Полярная ось и экватор служат основными элементами этой системы координат. Угол, который отсчитывается в плсокости экватора называется прямым восхождением, а угол, который отсчитывается вдоль меридиана от плоскости экватора называется склонением. Повторим, что такая система небесных координат возникла исторически в древнем мире и сохраняется в астрономии до сих пор.
Плоскость экватора (или положение полярной оси) определяет начало отсчета угла по склонению. Вторая основная точка системы координат, начало отсчета выбирается для того, чтобы указать точку от которой отсчитывается вращение Земли. Такая точка исторически была выбрана как точка пересечения небесного экватора и эклиптики. Экватор - плоскость перпендикулярная полярной оси и прекрасно подходит для задания угловой координаты. Кроме суточного вращения Земля испытывает еще и годовое вращение вокруг Солнца. В таком годовом вращении существует полюс эклиптики (ось орбиты Земли вокруг Солнца) и плоскость эклиптики, которая перпендикулярна полярной оси эклиптики. Экватор и эклиптика наклонены друг относительно друга на угол примерно , точка пересечения используется для определения начала отсчета прямого восхождения. Остается добавить, что в математической физике, в сферической системе координат, прямое восхождение обозначается обычно , эквивалентом второй астрономической координаты - склонения является сферическая координата .
Такое определение астрономической системы координат сохранялось в
течение многих веков. В последнее десятилетие произошло существенное
изменение. В 1991 г. Международный Астрономический Союз (МАС или IAU
- английская абревиатура) принял новую астрономическую систему
координат основанную на наблюдениях радиоисточников. Эту систему
назвали ICRF
Звезды обладают собственным движением, поэтому их положения меняются, изменение положения характеризуется собственными движениями (угловыми скоростями звезд по небу). Помимо этого, индивидуального для каждой звезды движения, существует единое движение всей небесной cистемы. Это движение связано с изменением ориентации Земли в космическом пространстве. Существует по крайней мере три движения - прецессия, нутация и движения полюса Земли. Если первые два движения являются детеминированными и могут быть предсказаны с высокой степенью точности, то третье движение - движение полюса - является стохастическим. Независимо от природы этих движений они эквивалентны вращениям на некоторые углы Эйлера. Рассмотрим как это можно сделать.
Оси декартовой системы координат в некоторую текущую эпоху наблюдений можно определить через
повороты осей той же декартовой системы координат по отношению к
осям в другую эпоху соответствующую началу отсчета как
(1.10) |
Здесь мы написали только матрицы соответствующие нутации и прецессии . Вектора и обозначают единичные вектора в эпохи и соответственно. По соглашению в астрономии первый вектор называют средним вектором (в эпоху ), а второй - истинным единичным вектором в эпоху . Эти определения "средний" и "истинный" используют также и для других астрономических терминов, определяя таким образом положения звезд, орты систем координат, небесный экватор, положение точки весеннего равноденствия, полюс и т.п.
Матрица прецессии в уравнении (1.10)
представляет вращение за счет общей прецессии за период времени . Для правых экваториальных систем
координат (первая ось направлена в точку весеннего равноденствия,
третья ось перпендикулярна небесному экватору) вращение определяется
тремя последовательными поворотами:
(1.11) |
Здесь матрицы являются вращениями вокруг оси , так что
(1.12) |
отметим, что по сравнению с математическим определением угла Эйлера поворот здесь выбран в другую сторону.
Отметим также поворот осуществляется не вокруг оси оси
, а вокруг оси :
(1.13) |
Углы , , являются функциями времени, они
представляются в виде многочленов [
(1.14) |
Здесь - J2000.0 выражено в юлианских столетиях временной шкалы TDB (аббревиатура TDB означает динамическое барицентрическое время, поодробнее об определении различных сиистем времени в астрономии можно будет прочитать в книге В.Е.Жарова).
Матрица представляет вращение обусловленное
нутацией. Для экваториальной системы координат она задается следущим
уравнением:
(1.15) |
где - средний наклон эклиптики, , - компоненты нутации по наклону и долготе. Наклон эклиптики к экватору является функцией времени и вычисляется в виде многочлена.
Для преобразования координат от декартовой системы к
экваториальной системе координат можно использовать, например,
уравнение для единичного вектора указывающего направление на
небесный источник:
(1.16) |
Мы сделали только преобразование от средней системы координат к
истинной экваториальной системе координат. Необходимо также сделать
преобразование от истинной экваториальной системы координат к земной
системе координат, в которой, собственно, и ведутся наблюдения. Для
этого придется сделать преобразование вида:
(1.17) |
здесь - матрица описывающее суточное вращение Земли, в которую, кстати, входит и движение полюса, а единичный вектор земной системы координат. Матрица задается в виде произведения трех матриц - две из которых описывают движение полюса, а третья определяется часовым углом истинного весеннего равноденствия, которое отсчитывается от Гринвичского меридиана, этот часовой угол называется также истинным Гринвичским звездным временем (GAST). Параметры движения полюса отсчитываются относительно одной из осей условной земной системы координат.
Преобразования типа (1.10, 1.11, 1.15) определяют преобразования координат звезд от положений указанных в каталогах, на момент времени наблюдений. Как видно из приведенных уравнений, для высокоточных наблюдений типа РСДБ - наблюдений, приведение источников на место согласно уравнениям (1.10, 1.11, 1.15) является необходимым условием для успешных наблюдений, поскольку разница от эпохи один год уже приводит к значительному уходу небесного источника от положения указанного в таблиицах. Причем в случае РСДБ наблюдений производится редукция от земной системы координат к небесной системе.
Такие преобразования являются первым шагом на пути редукции небесных источников на истинное положение. Здесь они приведены для полноты. В дальнейшем приведение на истинное положение (редукция) будет обобщена на случай учета релятивистских поправок, которые изменять тривиальные уравнения типа (1.10, 1.11, 1.15).
Принцип относительности Галилея сыграл большую роль в создании механики как точной науки.
Физика развивалась, после механики были открыты законы оптики и создана теория электромагнитного поля. Был экспериментально открыт факт, что скорость света - самого быстрого движения в нашем мире не зависит от скорости движения источника света.
Этот факт явно противоречил закону сложения скоростей и принципу относительности Галилея. Более того, принцип относительности Галилея противоречил уравнениям электродинамики и электромагнитного поля.
Основная трудность, которую надо было преодолет путем применения принципа относительности к электродинамике, заключалась в том, что надо было согласовать два противоречящих друг другу утверждения:
Первое утверждение носило теоретический, концептуальный характер, тогда как второе было основано на опыте. Поскольку второе утверждение основано на опыте, то его ценность выше и следует отказаться отпервого утверждения и тем самым от тех представлений о пространстве и времени, которые были приняты ранее.
Одно из представлений от которых мы отказываемся - ньютоновское понятие одновременности. Ньютон, постулируя существование абсолютного времени, или абсолютной длительности, писал: "время течет всегда одинаково, безотносительно к чему либо внешнему".
В 1905 г. А.Эйнштейном был сформулирован принцип специальной относительности, который был справедлив для применения к теории электродинамики и теории электромагнитного поля и заложил новый взгляд на пространство и время.
В специальной теории относительности появляется новое определение понятия одновременности.
Одновременность событий. Два события происходят в один и
тот же момент времени синхронизированных часов в различных точках
пространства. Возникает новое определение синхронизованных часов.
Пусть в точках и есть часы. Определяем, что время
прохождения света из в равно времени прохождения света из
в . Поясним это на рис. 1.3.
Пусть в момент времени из посылается световой сигнал, он
достигает точки в момент времени , отражается и достигает точки в момент времени . Часы по определению идут в точках
и синхронно если
(1.18) |
Принимаются также две аксиомы:
А.Эйнштейн также сформулировал два принципа: принцип относительности и принцип постоянства скорости света.
Принцип относительности
Законы, по которым изменяются
состояния физических систем, не зависят от того, к которой из двух
координатных систем, движущихся друг относительно друга прямолинейно
и равномерно, эти изменения относятся.
Принцип постоянства скорости света
Каждый луч света
движется в избранной системе координат со скоростью , независимо от того, испускается ли
этот луч покоящимся или движущимся телом. При этом скорость луча
света определяется согласно:
Скорость света=
Несмотря на абстрактность эти определения особенно важны для интерпретации астрономических наблюдений. Продемонстрируем это утверждение на простом примере.
Некоторое время назад он представлял из себя загадку для сообщества астрономов, которая бросила вызов теории относительности.
Рассмотрим рис. 1.4. Пусть из источника выбрасывается материя (например, сгустки плазмы). Эти сгустки летят под углом к направлению на наблюдателя. Чему равна видимая поперечная скорость перемещения этих сгустков по небу?
Эта задача возникла при анализе т.н. сверхсветовых движений в квазарах. Из многих квазаров наблюдаются выбросы большого количества вещества. При наблюдениях выбросов астрономы измеряли их угловые скорости. По их красному смещению определялось расстояние до квазаров. Умножая расстояние до квазаров на угловую скорость перемещения выбросов по небу астрономы получали поперечную скорость движения выброса. Стандартная процедура дала неожиданный результат. В нескольких случаях поперечная скорость движения выбросов оказалась больше скорости света!
Астрономы были поставлены перед нелегкой задачей. Казалось, что надо сделать выбор из двух, одинаково плохих вариантов. Первый - признать, что в природе могут существовать скорости больше, чем скорость света. Просто они не встречаются ни в солнечной системе, ни тем более в лабораторных условиях. Второй вариант - признать, что красное смещение в квазарах - не результат космологического красного смещения, а следовательно квазары могут быть расположены к нам гораздо ближе. Оба варианта, как я уже сказал были плохими.
Однако, решение задачи оказалось возможным в рамках как специальной теории относительности, так и в рамках космологического сценария существования квазаров. Решение, найденное П.Шейером, основывалось на правильном обращении с понятием одновременности.
Рассмотрим движение одного сгустка вещества. Пусть в момент
времени он выбрасывается из источника под углом к направлению . Сгусток представляет из себя
плазму, излучающую радиоволны. Поэтому одновременно с выбросом
сгустка, к наблюдателю по направлению идет световой сигнал (фотоны
радиочастоты) о том, что сгусток выброшен. Сгусток движется со
скоростью и через некоторый интервал времени
оказывается в положении . К этому времени световой сигнал
прошел путь и оказался в точке . Сгусток продолжает излучать
радиофотоны. Поэтому через время из точки в направлении наблюдателя вновь идет
сигнал о том, что сгусток достиг . Построим вспомогательный
перпендикуляр из на прямую соединяющую и . Вычислим продольное расстояние между точками и . Оно равняется:
Поперечное расстояние между точками и равняется величине:
Угол между прямыми и ничтожно мал (мы считаем, что
расстояние до квазара значительно превосходит все остальные масштабы
рассматриваемой задачи). Поэтому сигналы о том, что сгусток вышел из
источника и пришел в точку придут к наблюдателю через интервал
времени , а поперечное расстояние пройденное
этим сгустком будет составлять . Теперь можно разделить поперечное
расстояние на интервал времени между событие 1 (выход сгустка из
источника) и событием 2 (появление сгустка в точке ) получаем видимую скорость
перемещения сгустка по небу:
Отсюдя видно, что когда скорость движения сгустка близка к скорости света, а угол мал, видимая скорость движения сгустка по небу может значительно превышать скорость света.
Рассмотрим подробнее условия при которых видимая скорость
перемещения сгустка по небу будет превышать скорость света. Итак,
будем считать, что
(1.19) |
Значит, когда угол находится в пределах 0 наблюдатель видит сверхсветовое перемещение сгустка по небу.
В этом примере сверхсветовое движение было объяснено без выхода за рамки специальной теории относительности. Здесь основную роль сыграло правильное обращение с понятием одновременных событий ( в данном случае одновременный приход сигналов к наблюдателю).
3. Ускоренные системы отсчета >>Поэтому одной из основных наших задач будем вывод уравнений редукции и их решения для четырехмерного вектора импульса фотона.
Прежде чем выводить основные кинематические уравнения СТО сформулируем принцип постоянства скорости света на языке математики.
Рассмотрим опять две системы, движущиеся равномерно и прямолинейно друг относительно друга. Будем считать, что система неподвижна относительно наблюдателя, а система движется со скоростью . Пусть в из точки с координатами в момент выходит луч света и достигает точки с координатами в момент . В системе эти два события выглядят следущим образом. В момент из точки с координатами выходит луч света, который попадает в точку с координатами в момент времени .
Из уравнений теории электромагнитного поля ( уравнений Максвелла)
мы знаем, что пространственно - временная точка , связана с пространственно -
временной точкой , равенством вида:
(2.1) |
Здесь -скорость света. Постулат об
одинаковости скорости света в обеих системах координат можно
сформулировать так, что равенство (2.1)
справедливо и в системе координат :
(2.2) |
Обратим внимание, что в системе уравнение содержит , а не , поскольку две эти величины равны друг другу.
Теперь будем считать, что точки 1 и 2 лежат бесконечно близко
друг к другу, а также будем считать, что интервал времени для
распространения света из 1 в 2 является бесконечно малым. Тогда
упомянутые равенства можно записать как:
(2.3) |
Введем теперь понятие 4 мерного интервала между двумя
событиями. Будем называть первым событием то, которое произошло в
точке с координатами в момент , а вторым событием то, которое
произошло в точке с координатами в момент . Определим 4 мерный интервал между первым и
вторым событием как расстояние в псевдоэвклидовом пространстве:
(2.4) |
Из инвариантности скорости света следует, что интервал между двумя событиями - излучением света из какой -либо пространственной точки и приемом света в другой точке равен нулю в любой инерциальной системе отсчета. Т.е. в системе и в системе .
4 мерный интервал является инвариантом при преобразованиях координат, его величина не зависит от того в какой системах отсчета рассматриваются координаты между событиями. Воспользуемся этим свойством для вывода правильных преобразований координат между двумя системами, которые движутся относительно друг друга.
Рассмотрим две движущиеся системы координат. Из принципа
постоянства скорости света, а также из инвариантности мерного интервала можно заключить,
что в двух системах координат и , связанных линейными
преобразованиями вида
(2.5) | |||
(2.6) | |||
Коэффиценты преобразования проще всего выбрать в виде:
(2.7) | |||
Рассмотрим дифференциалы (2.5) и
подставим их в выражения для 4 мерного интервала. Легко видеть, что
равенство
Раасмотрим теперь связь угла в выражениях для гиперболических
синуса и косинуса со скоростью системы относительно системы . Рассмотрим движение центра системы
в системе координат . Центр системы координат находится в точке . В системе координат точка движется согласно системе уравнений:
(2.8) | |||
Теперь выражая гиперболические синус и косинус через
гиперболический тангенс приходим к уравнениям для преобразования
координат:
(2.9) |
Отметим, что преобразования (2.9)
больше похожи на преобразования типа вращения (1.3),
а не преобразования Галилея (1.1).
Рассмотрим теперь предел малых скоростей, когда , разложим преобразования (2.9) в
ряд Тэйлора по степеням этого малого параметра и оставим только
линейные величины по пренебрегая квадратичными и более
высокими степенями отношения взаимной скорости движения систем к
скорости света:
(2.10) | |||
(2.11) | |||
(2.12) |
Второй член в пребразовании времени выписан специально для того, чтобы продемонстрировать, что в преобразовании времени содержатся следы от преобразований Лоренца, но они второго порядка по отношению . Таким образом, преобразования Лоренца сводятся к преобразованиям Галилея. Поэтому в пределе малых (по сравнению со скоростью света) скоростей зависимость координаты от времени приобретает вид преобразования типа сдвига, время становится внешним параметром по отношению к преобразованиям трехмерных координат. Время становиться неизменным, внешнее влияние на этот параметр отсутствует.
Рассмотрим покоящуюся систему отсчета . Рассмотрим в ней два события, скажем, колебание математического маятника, покоющегося относительно этой системы. Первое событие - прохождение маятника через точку равновесия, а второе - его повторное прохождение через равновесную точку. Пространственное расстояние между двумя событиями равно нулю , , . Тогда интервал между двумя этими событиями определяет интервал собственного времени .
Это определение принятое в специальной теории относительности остается справедливым и в общей теории относительности.
Рассмотрим теперь зависимость интервалов времени и длины от
состояния движения. Пусть в системе покоятся часы. Рассмотрим два
события в системе . Первое событие - показание часов
в точке , , . Второе событие - показание часов
сек в той же точке пространства.
Время в системе координат между этими событиями есть сек. Интервал между этими событиями
есть см/сек сек=300 000 км. Найдем время,
которое прошло между этими событиями в системе , в которой покоится наблюдатель
измеренное по часом этого наблюдателя. Преобразование времени из
системы в систему осуществляется по формуле:
Итак, для наблюдателя, который покоится в системе координат часы показывают, что прошло больше времени, чем 1 сек. Это один из самых неожиданных выводов специальной теории относительности. Для неспециалистов этот вывод представлялся парадоксальным и послужил одним из поводов для попыток теоретически опровергнуть специальную теорию относительности, доказать ее внутреннюю противоречивость.
Одним из наиболее распространенных способов опровергнуть СТО служил т.н. парадокс близнецов. Он формулировался следущим образом.
Рассмотрим двух братьев - близнецов. Один из них улетает на ракете в длительное путешествие. Ракета двигается со скоростью близкой к скорости света, так что Второй остается на Земле. Первый брат после путешествия возвращается на Землю. Его собственные часы показывают, что прошло, скажем, один год. Часы второго брата показывают, что прошло 10 лет. Вывод: брат - близнец живщий на Земле постарел на 10 лет, в то время как его брат - путешественник постарел только на один год.
"Хорошо" - говорит желающий опровергнуть СТО. "Теперь давайте
рассмотрим ситуацию с точки зрения брата - путешественника. С его
точки зрения Земля движется со скоростью близкой к скорости света, а
следовательно, на Земле часы должны идти медленнее. Брат -
путешественник, вернувшись на Землю обнаружит, что у его брата -
близнеца часы показывают только 365 дней."
"Парадокс!"
восклицает опровергатель,
"Это доказывает внутреннюю
противоречивость СТО!"
После чего делается вывод, что СТО не
верна.
Разумеется, этот вывод основан на ошибке. Ошибка заключается в том, что космонавт, путешествующий на ракете, часть пути находится в неинерциальной системе отсчета. Поэтому две системы неэквивалентны. Доказано это будет, когда мы познакомимся с вычислением собственного времени в ускоренных системах отсчета. Пока же ограничимся указанием на то, что брат - близнец оставшийся на Земле, постареет больше чем путешественник.
Рассмотрим теперь как меняются собственные длины стержней в движущейся и покоющейся системах отсчета.
Для этого выпишем преобразование пространственной координаты (2.9) из
движущейся в неподвижную систему:
(2.13) |
Размер стержня в неподвижной системе обозначим . В покоящейся системе отсчета его
размер определяется выражением:
(2.14) |
(2.15) |
Пусть стержень длиной в собственной системе отсчета движется со скоростью относительно фотоаппарата далекого наблюдателя. За стержнем параллельно ему расположена линейка с нанесенными метками длины, которая покоится относительно наблюдателя. Направление на фотоаппарат составляет угол с направлением скорости стержня. Чему равна кажущаяся длина стержня? Какая часть мерной линейки закрыта стержнем?
Рассмотрим теперь общие преобразования систем координат, которые включают в себя не только четырехмерные повороты связывающие ось времени и одну из пространственных осей, но также и трехмерные вращения. Такие общие преобразования позволяют сделать редукцию на момент наблюдений.
Как и в параграфе посвященном обсуждению вращений рассмотрим
линейное преобразование типа:
(2.16) |
Напишем несколько дополнительных условий на вращение. Теперь
преобразования такого типа должны оставлять инвариантной четырех
форму вида:
(2.17) |
тогда такие преобразования называются преобразованиями Лоренца.
Введем матрицу:
(2.18) |
при преобразованиях Лоренца имеет место равество
здесь означает транспонированную матрицу. Отсюда легко заключить, что , следовательно существует обратное преобразование , которое также является преобразованием Лоренца. Произведение двух преобразований Лоренца также дает преобразование Лоренца, поэтому преобразования Лоренца образуют группу. Уравнение определяет в четырехмерном пространстве конус (его называют световым конусом). Световой конус делит все пространство - время на две внутренние полы конуса, в которых и внешние области, в которых .
Пусть - матрица преобразования (вращение)
трехмерного пространства. Рассмотрим преобразование в четырехмерном
пространстве вида:
Это преобразование принадлежит группе преобразований Лоренца. Оно оставляет без изменения координату в сумме (2.17) и не меняет сумму . Поскольку с каждым таким преобразованием можно отождествить вращение, то легко видеть, что трехмерные вращения образуют подгруппу преобразований Лоренца.
Напишем матрицу поворота с учетом четвертой координаты:
(2.19) |
Здесь в качестве элементов матрицы четырехмерных поворотов использованы элементы матрицы трехмерных поворотов .
Рассмотрим теперь четырехмерные линейные преобразования типа (2.16). Отметим, что такие линейные преобразования являются преобразованиями типа вращения, но не преобразованиями типа сдвига. Для начала найдем преобразование связанное с вращением временной координаты.
Преобразования связанные с преобразованиями Лоренца включающими временную координату, но исключающие вращения пространственных координат математики называют преобразованиями гиперболического поворота, а физики бустами, т.е. преобразованиями меняющими скорость системы координат.
Рассмотрим преобразование в плоскости . Такое преобразование не должно менять форму . Именно это преобразование математики называют иногда гиперболическим поворотом. Матрицу гиперболического поворота можно записать аналогично матрицам обычного поворота, заменив тригонометрическое косинус и синус на гиперболические косинус и синус:
В четырехмерном виде эта матрица будет иметь вид
(2.20) |
Подобным же образом будут выглядеть матрицы, которые описывают повороты в плоскостях , . Матрицу сложного поворота, описываемую как тригонометрическими функциями, так и включающую гиперболический поворот, описываемый гиперболическими функциями можно получить пользуясь теоремами сложения тригонометрических и гиперболических функций.
Тем не менее в астрономии проще использовать преобразования Лоренца найденные в другом виде, который мы сейчас обсудим.
Рассмотрим вновь общие преобразования Лоренца вида (2.16), но записанные для дифференциалов координат. Пусть система покоится относительно наблюдателя, а система движется относительно него с произвольной скоростью .
Преобразования описываются уравнением:
(2.21) |
У наблюдателя сопутствующего системе меняется только время, которое
является собственным временем этого наблюдателя. Дифференциалы
пространственных координат этого наблюдателя в системе равны нулю, поскольку координаты
неизменны. Поэтому вектор описывающий изменение дифференциалов
наблюдателя есть . В системе дифференциалы наблюдателя есть:
(2.22) | |||
(2.23) | |||
Отношение определяет скорость движения
координатных систем друг относительно друга. Поэтому можно записать
равенство:
(2.24) |
Напомним, что . Выведем второе уравнение для связи
и . Для этого вычислим интервал между
событиями разделяемыми дифференциалами в системе и дифференциалами в системе . Тогда можно записать уравнение
вида:
(2.25) |
Отсюда легко найти (поскольку в системе сопутствующей наблюдателю
справедливо равенство ), что:
(2.26) |
Теперь подставляем в уравнение (2.26)
уравнение определяющие различные элементы матрицы буста через
скорости (2.24) и
получаем уравнения для определения элементов матрицы :
(2.27) | |||
где .
Уравнения (2.25,
2.26)
являются следствием более общего уравнения:
(2.28) |
Пользуясь этим уравнение можно найти элементы матрицы с двумя пространственными индексами. Следует, однако, сразу сказать, что элементы этой матрицы определяются неоднозначно. Они всегда могут быть умножены на матрицу трехмерного вращения.
Выберем вид трехмерных элементов четырехмерной матрицы вращения
как:
(2.29) |
Заметим, что векторные компоненты с нижними индексами отличаются знаком от векторных компонент с верхними индексами .
Произвольное преобразование Лоренца может быть выражено как
произведение трехмерного вращения с бустом, который описывается
матрицей . Доказательство этого утверждения
выходит за рамки курса, но читатель, знакомый с теорией групп легко
воспроизведет его. Представим произвольное преобразование Лоренца в
виде:
(2.30) |
В таком виде преобразования Лоренца легко применять для получения уравнений редукции.
Из курса линейной алгебры известно, что при преобразованиях вида
(2.21)
вектора преобразуются как
(2.31) |
Кроме этого, общего, уравнения можно также привести еще несколько
уравнений, которые являются очень полезными при выводе уравнений
редукции, хотя они обладают меньшей общностью, чем (2.31).
Одним из таких уранений является скалярное произведение векторов.
Скалярное произведение двух векторов:
является инвариантом координатных преобразований. Докажем это для
линейных преобразований вида (2.21).
Пусть вектора и заданы в системе , сделаем преобразование вида (2.21)
к новой системе координат , которая движется со скоростью относительно системы , кроме того, оси системы повернуты относительно первой
системы в произвольном направлении, которое характеризуется тремя
углами Эйлера. Теперь вычислим компоненты векторов и в новой системе :
и
Скалярное произведение векторов в системе выражается через произведение
векторов в системе с матрицами преобразования:
Прямым вычисление произведения мариц можно показать, что
(2.32) |
Здесь - символ Кронекера или единичная
матрица
(2.33) |
Подставим (2.33) в (2.32) и полчим, что скалярное произведение векторов в двух системах координат равно друг другу. Это и означает, что скалярное произведение является инвариантом при преобразованиях Лоренца. Заметим сразу, что скалярное произведение является инвариантным при любых, даже нелинейных преобразованиях. Доказательство этого утверждения отложим до пятой лекции.
Кроме векторов нам иногда придется производит вычисления с объектами более сложной природы - тензорами и тензорными плотностями.
Тензор второго ранга эквивалентен четырехмерной квадратной
матрице . Этот тензор преобразуется согласно
правилу:
в случае, когда надо преобразовать тензоры второго ранга с двумя нижними индексами или с одним верхним и одним нижнем индексами необходимосуммировать их с матрицами с двумя верхними индексами суммирования или со смешанными индексами суммирования.
Тензоры более высокого ранга при преобразованиях содержать больше произведений матриц . тензоры третьего ранга три матрицы, тензоры четвертого ранга - четыре и т.п.
Кинематические и динамические величины в четырехмерном пространстве отличаются от соответствующих трехмерных величин. Вначале определим четырехмерную скорость.
Обычная трехмерная скорость определяется как отношение
пройденного пути на промежуток времени, за который этот путь
пройден:
Из этой формулы видно, что для определения скорости в трехмерном пространстве используется внешний по отношению трехмерному пространству параметр - время. Если мы построим траекторию пробной частицы в трехмерном пространстве в виде трех функций времени, которые есть:
то скорость можно определить также как касательный вектор
к этой траектории.
По аналогии с этим определением определяют четырехмерную скорость как вектор, касательный к четырехмерной траектории частицы. В качестве параметра вдоль траектории выбирают некоторый афинный параметр. Для частиц, которые обладают массой и движутся со скоростью меньше чем скорость света в качестве афинного параметра вдоль траектории обычно выбирают интервал:
(2.34) |
Отметим важное отличие четырехмерной скорости, определенной
согласно (2.34)
от трехмерной скорости. Абсолютная величина трехмерной скорости
является произвольной величиной. Абсолютная величина четырехмерной
скорости равна единице.
(2.35) |
В случае, когда мы рассматриваем пробную частицу, которая движется со скоростью света (например, фотон), то в качестве параметра вдоль траектории выбирают другой афинный параметр, например, путь, пройденный фотоном. Четырехмерный интервал вдоль траектории частицы движущейся со скоростью света уже выбирать нельзя, поскольку он равен нулю.
Приведем явный вид четырехмерной скорости через трехмерную:
(2.36) |
Приведем также уравнение для редукции волнового вектора фотона к
наблюдателю. Для этого воспользуемся тем свойством, что векторное
произведение волнового вектора фотона и четырехмерной скорости наблюдателя
является инвариантной величиной
(2.37) |
Инвариантность относительно преобразования системы координат
означает, что не меняет своего значения при
переходе от, скажем, покоющейся системы координат, к движущейся.
Рассмотрим некоторого наблюдателя и его четырехмерную скорость . В системе координат сопутствующей
наблюдателю вектор скорости принимает значение
Соответственно скалрное произведение двух четырехмерных векторов вырождается в произведение двух величин: нулевой компоненты волнового вектора фотона и нулевой компоненты четырехмерной скорости. Поскольку второй сомножитель равен единице, то остается только одна величина компонента волнового вектора фотона. Эта компонента отождествляется с наблюдаемой частотой фотона (или с энергией фотона в системе координат, сопутствующей наблюдателю) . Таким образом определяется значение , которая стоит в правой части уравнения (2.37).
Значение константы в правой стороне равенства (2.37), разумеется, будет другим для другого объекта. Рассмотрим в качестве другого тела источник фотонов. Вычислим правую часть (2.37) в системе координат, которая сопутствует источнику. Теперь константа в правой стороне равенства будет определять частоту излучения . Естественно, что величина константы будет уже другая.
Cоставим теперь отношение двух величин. Числитель этого отношения
- произведение четырехмерной скорости источника фотонов на волновой
вектор фотона. Знаменателем является скалярное произведение
четырехмерной скорости наблюдателя в системе координат ему
сопутствующей.
(2.38) |
Здесь индекс означает "наблюдатель", а индекс означает "излучатель". Величина обычно называется красным смещением, она пришла в релятивистскую теорию из космологии, в космологии это один из основных параметров, который характеризует источник.
Поскольку справа стоит отношение двух констант, которые мы уже
вычислили, то напишем это отношение явно:
(2.39) |
Теперь для того, чтобы вычислить частоту фотона, которую будет измерять наблюдатель, поступим следущим образом. В системе координат, сопутсвующей наблюдателю, волновой вектор фотона имеет компоненты
здесь -вектор в направлении излучения фотона. Все величины вычислены в системе координат сопутствующей наблюдателю.
Излучатель имеет четырехмерную скорость
где -трехмерная скорость источника фотонов относительно наблюдателя.
Скалярное произведение в системе координат наблюдателя есть
(2.40) |
Теперь получаем, что отношение частоты излучателя к частоте того
же фотона в системе наблюдателя есть:
(2.41) |
Это есть закон Допплера в специальной теории относительности.
Рассмотрим уравнение (2.41) более подробно.
Будем считать, что источник фотонов и наблюдатель находятся на
оси и источник движется вдоль этой оси.
Пусть излучатель движется по направлению к наблюдателю. Тогда и наблюдаемая частоты больше частоты
излучателя:
Частота фотонов смещается в голубую сторону спектра, мы имеем дело с голубым смещением.
В том случае, когда направление распространения фотонов
противоположно движению источника возникает эффект красного смещения
частоты:
Рассмотрим еще один любопытный пример. А именно, под каким углом к направлению распространения фотонов должен двигаться источник, чтобы смещение частоты отсутствовало? Итак, на языке математики эту задачу можно сформулировать следущим образом: Найти такое значение при условии , для которого .
Из условия равенства частот получаем, что косинус угла между
направлением движения источника фотонов и направлением на
наблюдателя есть:
Из приведенного уравнения видно, что эффект смещения частоты может отсутствовать лишь для источника удаляющегося от наблюдателя.
Уравнение (2.41) описывает изменение частоты при переходе от движущегося источника к неподвижному наблюдателю. В реальности обычно источник фотонов и наблюдателя разделяет некоторое расстояние. Изменение частоты фотона при рапространении формула (2.41) не описывает. Если в пространстве между источником фотонов и наблюдателем присутствует, например, гравитационное поле, то появляется дополнительное изменение частоты, которое должно быть учтено.
4. Эксперименты по ОТО >>Теперь вкратце расскажем как А.Эйнштейн смог описать ускоренные системы отсчета в терминах принципа относительности, как стало понятно, что это описание приводит к геометрической трактовке гравитационного поля, необходимости введения неэвклидовой геометрии в физику и идеи искривленного пространства - времени. Основная идея стала понятной А.Эйнштейну в 1907 г., хотя в оригинальном виде она была опубликована только в 1972 г. в газете "New York Times". Это идея позже получила название релятивистского принципа эквивалентности Эйнштейна. Сам А.Эйнштейн описал то время и мысли в отрывке, который помещен ниже. Перевод этого на русский язык слишком красив, чтобы его опустить:
" Я пытался модифицировать теорию гравитации Ньютона таким
образом, чтобы она точно соответствовала специальной теории
относительности. Попытки сделать это показали, что теория гравитации
может быть согласована с принципами специальной теории
относительности, но они не удовлетворяли меня, поскольку требовали
введения гипотез не содержащих физических основ. В это время ко мне
пришла счастливейшая идея моей жизни
Точно также, как
электрическое поле создается электромагнитной индукцией,
гравитационое поле может существовать только относительно.
Следовательно, для наблюдателя, находящегося в свободном падении с
крыши дома, гравитационного поля не существует ( по крайней мере в
бесконечно близкой его окрестности ) в течении всего времени
падения. Если наблюдатель выпустит из рук какие - либо предметы они
остануться относительно этого наблюдателя в состоянии покоя
независимо от их химического состава или физического состояния
Чрезвычайно интересный эмпирический закон гласящий, что все тела в одном и том же гравитационном поле падают с одним и тем же ускорением, получал в этом случае глубокий физический смысл. Если бы нашелся хотя бы один предмет, который падал бы в гравитационном поле не так как другие, то наблюдатель сравнивая свое движение с движением этого предмета смог бы сказать, что он находится в гравитационном поле и что он падает под его воздействием. Но если такого предмета не существует, а эксперимент подтверждает этот факт с большой степенью точности, наблюдатель теряет всякое объективное основание рассматриваться свое состояние как состояние падения в гравитационном поле. Скорее он имеет право рассматривать свое состояние как состояние покоя и считать, что в его ближайшем окружении гравитационное поле отсутствует.
Таким образом, известный экспериментальный факт, что ускорение в гравитационном поле не зависит от химического состава или физического состояния становится могучим аргументом для распространения принципа относительности на координатные системы, которые движутся неравномерно одна относительно другой."
Рассмотрим на рис. 3.1 пояснения к принципу эквивалентности Эйнштейна, который распространяет принцип относительности на ускоренные системы координат.
На левом рисунке изображен лифт, ускоряемый вверх с величиной ускорения равной . Свет, изображенный на рисунке пунктриной линией движется в таком лифте по искривленной траектории. Эта искривленная траектория является идеально прямой линией, но в покоящейся системе отсчета. В ускоренной системе отсчета линия становится искривленной. На правом рисунке изображен тот же самый лифт, который находится в поле тяжести с однородным ускорением. Принцип относительности примененный к ускоренным системам отсчета гласит, что невозможно отличить две этих ситуации. Значит, в лифте, который находится в гравитационном поле свет тоже должен двигатся по искривленной траектории.
Вычислим характеристики света при движении в однородном поле тяжести пользуясь характеристиками света в ускоренном лифте. Для этого рассмотрим фотоны, которые распространяются вдоль поля тяжести . Это гравитационное поле исходя из принципа эквивалентности можно заменить полем ускорения с равной величиной, но противоположным знаком. Рассмотрим лазер , который излучает фотоны с частотой (эта частота измеряется наблюдателем, находящимся рядом с лазером, т.е. сопутствующего лазеру). На расстоянии от лазера (по направленнию движения) находится другой наблюдатель , который тоже измеряет параметры света. Свет, который вышел из лазера в момент времени достигнет наблюдателя в момент времени , а сам наблюдатель будет иметь скорость относительно лазера равную .
Рассмотрим теперь две дополнительные инерциальные системы координат, которые двигаются равномерно и прямолинейно, так что ускорение в этих системах равно нулю. В первой системе координат в начале системы находится наблюдатель . Скорость и положение этой системы выбраны так, чтобы в момент врмени наблюдатель находился в бесконечно малой окрестности точки ускоренной системы координат. Вторая инерциальная система движется со скоростью относительно первой так, чтобы в момент времени ее начало, в котором нахордится наблюдатель совпало с положением наблюдателя , находящегося в ускоренной системе координат.
Привлечение дополнительных инерциальных систем координат сделано не для того, чтобы запутать студента, а для того, чтобы провести расчеты характеристик света пользуясь уже знакомыми формулами специальной теории относительности.
Частота фотона измеренная наблюдателем в момент времени есть , согласно нашему определению. В момент времени частота того же фотона, измеренная наблюдателем , движущемся со скоростью относительно есть
Лазер представляет из себя стандартный электромагнитный
осциллятор с собственнолй частотой и с периодом . Соответственно, наблюдатель будет измерять период осциллятора:
Произведение ускорения на расстояние представляет разность
гравитационных потенциалов между двумя точками. В первой точке
находится лазер, во второй нахаодится наблюдатель: . Теперь можно привести формулу
определяющую темп течения времени в двух точках и :
(3.1) |
Подставим эту формулу в уравнение для четырехмерного интервала.
Поскольку (3.1)
представляет связь собственного времени точки , т.е. с координатным временем (которое мы относим к собственному
времени точки , в которой потенциал нулевой), то
можно записать четырехмерный интервал как функцию собственного
времени и как функцию координатного времени:
(3.2) |
Основное изменение по сравнению с прежней величиной, которая характеризовала "расстояние" между событиями в СТО - появление коэффицента перед квадратом дифференциала времени. Этот коэффицент, вообще говоря, является функцией всех четырех координат. Такие функции появляются в том случае, когда метрика является неэвклидовой, а геометрия описывает искривленное пространство - время. Поэтому новая физика - описание сильных гравитационных полей - характеризуется неэвклидовой геометрией. Для работы в общей теории относительности необходимо владеть аппаратом неэвклидовой геометрии, которая будет излагаться позже в этом курсе.
Вернемся к формуле (3.2).
В том случае, когда наблюдатель движется в поле со скоростью , то его собственное время связано с координатным временем как:
(3.3) |
Для того, чтобы оценить скорость течения времени в гравитационном
потенциале различной величины проведем расчет на сколько "уходят"
друг относительно друга часы, находящиеся на полуденной и полуночной
стороне Земли в гравитационном поле Солнца. Будем считать, что член
пропорциональный квадрату скорости наблюдателей различается для двух
наблюдателей на пренебрежимо малую величину. Оценивать разность
скорости течения времени будем только по формуле (3.3).
(3.4) |
Тем не менее измерить подобный эффект можно также и на Земле и в ближнем космосе. Рассмотрим два интересных эффекта - изменение скорости хода часов в зависимости от сезона и изменение скорости хода часов установленных на спутнике системы GPS по сравнению с часами установленными на Земле.
Ось вращения Земли наклонена по отношению к плоскости земной
орбиты на угол . Поэтому часы, скажем 1 и 2 с
собственным временем и , которые находятся на разных
широтах, соответственно и , находятся также при разных
значениях гравитационного потенциала Солнца. Естественно, что при
движении Земли по орбите возникает годовая гармоника в изменении
скорости хода часов:
Здесь в качестве начала отсчета выбран день летнего солнцестояния. На коротких промежутках времени, значительно меньших длительности года такое изменение скорости течения времени воспринимается как линейный дрейф часов, зависящий от широты! Величина этого дрейфа 15 наносекунд в день. Такой эффект действительно наблюдается и природа его никак необъяснима, если "забыть" про эффекты общей теории относительности.
Общая теория относительности изменила наши взгляды на структуру
пространства и времени. В течении долгого времени ОТО оставалась
теоретическим инструментом современной физики, который не имеет
приложений в технологии. Ситуация существенно измениласьс появлением
высокоточной навигации, с появлением спутниковых систем GPS и
ГЛОНАСС. Теперь для целей точной навигации (на поверхности Земли)
необходимо использовать уравнения общей теории относительности для
редукции наблюдений. Особенно важно использовать их для пересчета
стандартов времени на Земле и на спутниках. Высота полета спутников
превышает земной радиус, а скорость значительно превышает скорость
полета современных самолетов. Поэтому изменение скорости течения
времени особенно заметны. Собственноре время на борту спутника
обозначим , а на поверхности Земли обозначим
. Отношение двух интервалов
составляет:
Здесь индексы и соответственно относятся к потенциалу Земли на высоте полета спутника и скорости его полета, а также соответствующие величины для стандарта на Земле.
Итак, скорость течения времени на Земле и на спутнике различна. Для спутников системы GPS, которые находятся на высоте 14 000 км отличие двух темпов течения времени составляет 44 микросекунды в день. Естественно, для поддержания равномерной шкалы времени, единой для поверхности Земли и спутников необходимо учитывать это изменение.
5. Неэвклидова геометрия >>
Первый эксперимент был сделан в 1971 г.[
Эффект | Восток | Запад |
Потенциальный | 144 14 ns | 179 18 ns |
член | ||
Допплеровский | -184 18 ns | 96 10 ns |
член | ||
Полная | -40 23 ns | 275 21 ns |
задержка |
Эксперимент дал следущий результат:
Восток | Запад | |
Полная | -59 ns | 273 ns |
задержка |
Продемонстрируем на простых выкладках, как меняется собственное время часов, которые находятся на борту двух самолетов, один из которых летит на запад, другой на восток. Скорость самолета относительно земной поверхности обозначим . Самолет двигается с поверхности вращающейся Земли, его скорость относительно покоющейся системы координат складывается со скоростью вращения Земли . Выбирая соответсвующие знаки можно это равенство записать также . Здесь - геоцентрическая широта, которая может быть отождествлена с обычной географической широтой, поскольку сжатие Земли мало и при наших вычислениях им можно пренебречь.
В системе координат, которая связана со центром Земли, который
находится в состоянии свободного падения в поле тяжести Солнца и
планет, время отсчитывается собственными часами . В этой же системе координат
скорость самолета есть:
Разность собственного времени двух часов и определяется равенством:
Подставляя формулу для скорости самолета относительно центра
системы координат получаем, что на борту самолета который летит на
восток, скорость течения времени отличается от скорости течения
времени на борту самолета, который летит на запад. Эта разность
составляет
Здесь - компонента скорости самолета, направленная на восток. При этом считается, что скорости самолета, который летит на запада и самолета, летящего на восток равны друг другу.
Отсюда видно, что предсказания общей теории относительности были подтверждены с высокой (для того времени) точностью.
Измерения временной задержки зависящей от потенциала были сделаны
четыре года спустя [
Два года спустя подобный эксперимент был повторен в Японии [
Одни из наиболее точных измерений были сделаны во время высотного
полета ракеты [
Измерения времени задержки проводились также позже на самолетах. В полете осуществлялся постоянный контроль хода часов и стабильности параметров. В частности, был проведен эксперимент по проверке "парадокса близнецов". Были синхронизованы часы, после чего одни часы поместили на борт самолет, а вторые оставили на Земле. Часы, которые находились на борту самолета, по прилету показали, что на борту прошло больше времени, чем на Земле!
В чем дело? Может быть общая теория относительности неверна? Нет, измерения вновь полностью подтвердили справедливость общей теории относительности, просто надо делать правильные выводы из теоретических положений.
Классическая формулировка парадокса близнецов относиться к системам координат, которые свободны от неоднородного гравитационного поля. На Земле, разумеется, неоднородное гравитационное поле присутствует. Поэтому надо не только сравнивать задержку времени возникающую на борту самолет из - за движения самолет, но также и задержку времени возникающую из - за потенциального члена. Если самолет движется относительно лаборатории (пробных часов), то часы на его борту будут отставать от часов в лаборатории (это эффект пропорциональный ), но самолет летит выше лаборатории, он летит в поле тяжести с ослабленным потенциалом, а значит, часы, находящиеся в лаборатории будут идти медленнее по сравнению с часами, находящимися на борту (Здесь -разница высот между самолетом и лабораторией). Сравнить вклад потенциального члена и члена из - за скорости легко. Необходимо сравить величину характерной скорости в данном потенциале (вторая космическая скорость) с реальной скоростью аппарата.
Для самолет потенциальный член всегда больше. Скорость самолет значительно меньше скорости ракеты, поэтому часы, поднятые на самолете над лабораторией (если они, конечно, подняты на достаточно большую высоту) будут отставать по сравнению с часами, находящимися в лаборатории.
Теперь формулы для изменения темпа течения времени в зависимости от скорости и высоты используются в навигационной технологии GPS и ГЛОНАСС.
Рассмотрим теперь "парадокс близнецов" в его классической формулировке. Итак, рассматриваются двое часов, одни для простоты будем обозначать , вторые . Часы все время покоются относительно инерциальной системы координат . Часы вначале тоже покоются. Часы синхронизируются, затем часы начинают ускоряться вдоль положительных значений оси системы координат . Через некоторое время ускорение пропадает и часы по инерции движутся со скоростью вдоль оси некоторое время. Затем часы вновь ускоряются, но теперь в противоположном направлении, что приводит к их замедлению и полной остановке, а затем к началу движения в противоположном направлении. Часы ускоряются пока не достигнут скорости . Затем часы движутся в направлении к часам . В заранее расчитанный момент времени часы вновь начинают ускоряться в направлении противоположном движению так, чтобы скорость их уменьшалась. Ускорение вновь подбирается так, чтобы часы оказались в одной точке с часами c нулевой скоростью. После этого показания часов сравниваются. Ускорения в этом мысленном эксперименте можно сделать достаточно большими, так что влияние участков движения с ненулевым ускорением на процесс вычисления задержки часов можно считать пренебрежимо малым. Тогда часы должны отстать от часов на некоторый интервал времени. Итак, для наблюдателя, сопутствующего часам движущиеся часы должны отстать.
Рассмотрим этот же процесс с точки зрения наблюдателя сопутствующего часам . Он имеет противоположные характеристики, так что с его точки зрения "отстать" должны часы . Ниже мы проанализируем правильный ход рассуждений и покажем, что на самом деле для обеих наблюдателей часы должны отстать по сравнению с часами . Причиной неправильных рассуждений является наличие поля ускорения в системе координат сопутствующей часам . Поэтому изменения интервалов времени в системе сопутствующей надо считать уже по формулам общей теории относительности, а не только по формулам специальной теории относительности.
Одно из лучших изложений "парадакса близнецов" привел А.Эйнштейн
в своей популярной статье "Диалог по поводу возражений против теории
относительности" приведенной в книге [
С точки зрения | С точки зрения | |
1. Часы ускоряются внешними силами в направлении положительных значений оси , пока не приобретут скорость . Часы покоются. | 1. В отрицательном направлении оси возникает гравитационное поле, в котором падает ускоренно. Часы удерживаются внешними силами в покое. Когда приобретают скорость гравитационное поле исчезает. | |
2. Часы движутся с постоянной скоростью до точки 2. Часы покоятся. | 2. Часы движутся с постоянной скоростью до точки . Часы покоятся. | |
3. Часы ускоряются внешними силами пока не приобретут скорость . | 3. Появляется однородное поле тяжести направленое в сторону положительных значений оси , под действием которого ускоряются в положительном направлении до тех пор пока не приобретут скорость . После этого поле исчезает. Внешние силы удерживают часы . | |
4. Часы движутся назад с постоянной скоростью , пока не приблизятся к . Часы покоятся. | 4. Часы движутся со скоростью в направлении положительных значений оси , до тех пор, пока не приблизятся к . Часы остаются в покое. | |
5. Часы останавливаются внешними силами. | 5. Возникает поле тяжести, которое останавливает часы . Часы удерживаются внешними силами. |
Как видим, две системы координат неэквивалентны друг другу. С точки зрения наблюдателя сопутсвующего часам гравитационное поле отсутствует, с точки зрения наблюдателя сопутствующего часам гравитационное поле не равно нулю. Для вычисления скорости хода часов с точки зрения наблюдателя достаточно формул, выведенных в рамках СТО, с точки зрения наблюдателя при вычислении скорости хода времени необходимо учитывать эффекты ОТО.
Вновь аккуратно учитывая разницу между системами координат вычислим скорость хода часов в системе и в системе и сравним какие из часов отстануть от других.
Расчет будем вести применяя приближенные формулы СТО и ОТО для того, чтобы расчеты были легче и не затемнялся смысл формул, мы будем считать, что скорость значительно меньше чем скорость света.
Вначале рассчитаем задержку времени по формулам СТО с точки
зрения наблюдателя сопутствующего часам . Будем считать, что время ускорения
пренебрежимо мало. Тогда разность скорости хода часов во время
первой стадии, а также во время третьей и пятой стадии ппренебрежимо
мало. Тогда интервал времени показанный часами в течении всего
путешествия зависит от интервала времени
показанному часами как:
Итак с точки зрения наблюдателя сопутствующего часам часы отстают.
Проведем расчет скорости хода обеих часов с точки зрения наблюдателя сопутствующего часам . Во время первой стадии разность хода пренебрежимо мала. Оба чдена дают пренебрежимо малый вклад. Потенциальный - потому что часы и находятся практически только в одной точке, а вклад от потенциального члена пропорционален разности расстояний, член зависящий от скорости тоже мал.
Во время второй стадии движения по инерции, которая длится время, скажем, часы отстают от часов как .
Будем считать, что третья стадия длится интервал времени . Во время третьей стадии вклад члена пропорционального скорости часов в разность хода часов пренебрежимо мал. Однако велик вклад потенциального члена. Действительно за время часы прошли относительно часов расстояние . Ускорение, требуемое для изменения скорости с на в течении времени составляет .
Гравитационный потенциал между точками нахождения двух часов
составляет величину . Знак плюс выбран потому, что
ускорение направлено от к . После окончания третьей стадии из -
за потенциального члена интервал времени показанный часами и интервал времени показанный часами связаны равенством
В течении четвертой стадии часы вновь отстают от часов . Обратный путь длится тот же
интервал времени . За этот интервал часы вновь отстают. Интервал времени,
который показывают часы составляет:
В течении пятой стадии часы вновь замедляются гравитационным полем. Однако теперь разность хода часов и опять пренебрежимо мала, по тем же причинам, что и на первой стадии.
Посчитаем полный интервал времени, который показывают часы с точки зрения наблюдателя,
сопутствующего часам . Промежуток времени, который
показывают часы складывается из промежутков времени
показываемых этими часами с первой по пятую стадии:
В произвольной геометрии рассматриваются произвольные
преобразования координат:
например,
как видно из приведенных преобразований, они описывают просто переход от сферических к декартовым координатам.
Дифференциал в нетильдованной системе связан с дифференциалом в
системе координат с тильдой уравнениями вида:
В геометрии вводится понятие геометрического объекта. Не перечисляя всех объектов геометрии назовем только скаляры, векторы и тензоры. Строго говоря, все перечисленные величины являются тензорами, так скаляр является тензором нулевого ранга, а вектор тензором первого ранга. Однако исторически принято выделять скаляры и векторы.
Скалярная величина (или скаляр) при преобразованиях системы
координат не преобразуется,
Вектором называется величина, которая содержит четыре компоненты,
преобразуемые согласно правилу:
(5.1) |
для контравариантных компонент и
(5.2) |
для ковариантных компонент.
Как можно заметить, из закона преобразования (5.1) преобразование контравариантных компонент какого - либо вектора подобно преобразованию дифференциалов координат, представляющих разность положений двух точек. Следовательно контравариантные компоненты вектора можно представить как систему из двух точек, с указанием какая из точек является первой, а какая является второй. Примером контравариантных компонент является четырехмерная скорость какого - либо тела.
Примером ковариантных компонет вектора является градиент
некоторого поля:
Образом градиента от поля являются наборы двумерных поверхностей определяющих постоянство поля . Следовательно геометрическим образом ковариантных компонент тензора являются двумерные поверхности "раскрашенные" в различные "цвета" для того, чтобы определить какая из поверхностей является первой, а какая - второй.
Выпишем также правило по которому преобразуются компоненты
тензора второго ранга:
Геометрическая величина , которая имеет верхних ипндексов и нижних индексов и преобразуется по
закону:
называется тензором ранга с контравариантными ковариантными индексами.
В алгебре тензоров определяется суммирование тензоров одинакового
ранга и с одинаково расположенными индексами:
умножение определено для тензоров любого ранга с произвольно
расположенными индексами:
В тензорной алгебре определяют также свертку двух тензоров по
правилу:
для произвольного расположения индексов важно только, чтобы
индекс по которому проводится свертка в первом тензоре был верхним,
во втором - нижним (или наоборот, в первом - нижним, а во втором
-верхним). Положение и количество остальных индексов переносится в
свертку по их месту. Свертки могут быть образованы различными
способами, однако каждое суммирование должно выполняться по верхнему
и нижнему индексу. Например, сумма
не является тензором, как легко убедиться рассмотрев закон преобразования этой величины.
В современной тензорной алгебре, анализе и физике пользуются
правилом суммирования Эйнштейна, который для удобства ввел следущее
обозначение:
при этом индекс называют мертвым индексом и по
повторяющимся индексам производится суммирование. Так запись обозначает:
Повсюду в этой книге мы будем использовать это правило, два повторяющихся индекса один верхний, другой - нижний будет означать, что по ним производится суммирование.
Определим также обратные тензоры согласно уравнению:
Здесь - символ Кронекера, который
определяется следущими условиями если и если . Можнл также выписать матрицу
символа Кронекера
(5.3) |
Свертка двух тензоров понижает ранг произведения. Так, важный
пример показывает, что произведение ковариантных компонент вектора
на контравариантные компоненты является инвариантом:
(5.4) |
Различные авторы [
Геометрия четырехмерного пространства - времени полностью определяется десятью функциями, которые являются компонентами симметричного тензора второго ранга. Метрика четырехмерного интервала есть:
(5.5) |
Здесь - ковариантные компоненты метрического тензора или, как обычно говорят, метрический тензор второго ранга.
Компоненты метрического тензора являются, вообще говоря, функциями всех четырех координат.
Преобразованием координат всегда можно добиться того, чтобы
компоненты метрического тензора были приведены к виду метрики
Минковского:
(5.6) |
В пространстве с заданной метрикой можно определить связь между
ковариантными и контравариантными компонентами тензоров, так для
вектора связь между этими компонентами задается уравнениями:
Теперь можно определить норму вектора, аналогично тому, как это
делается в эвклидовой геометрии. Норомой вектора по определению
полагают величину [
(5.7) |
В зависимости от того, чему равна норма ветора его называют:
Норма называется также длиной вектора. Как видно из определения изотропного вектора он обладает нулевой длиной.
Рассмотрим свертку двух векторов. Два вектора, которые
удовлетворяют условию:
называются ортогональными. Отсюда можно сделать вывод, что изотропный вектор ортогонален самому себе и любому другому изотропному вектору. Следует заметить, что таким свойством обладают только изотропные вектора.
Кроме этого важного свойства приведем также уравнение описывающее
угол между двумя векторами и в неэвклидовой геометрии:
(5.8) |
Здесь следует заметить, что оба вектора и являются либо пространственноподобными, либо изотропными.
Приведем примеры метрики искривленного пространства. На самом деле в быту мы сталкиваемся с примера геометрии искривленного пространства значительно чаще, чем привыкли думать. Поверхность мяча, поверхность спинки кресла, поверхность кувшина или графина - вот неполный список двумерных искривленных пространств. Примеры идеальных плоскостей, таких как крышка стола или ровный листок бумаги в этом ряду выглядят, скорее исключениями, чем правилом.
Приведем в качестве примера метрику на поверхности сферы. Для
этого выпишем вначале метрику эвклидова пространства в сферической
системе координат:
Будем считать, что мы вычисляем расстояние только между теми
точками, которые лежат на поверхности сферы радиуса . Тогда можно полагать, что , а значит метрика получает вид:
(5.9) |
теперь метрика описывает поверхность сферы, а геометрия, которую описывает данный метрический тензор является неэвклидовой.
В эвклидовой геометрии очень важным понятием является прямая между двумя точками, которая к тому же является кратчайшим расстоянием между этими точками. В неэвклидовой геометрии понятие прямой заменяется понятием геодезической линии, которая является экстремальным путем между двумя точками.
Для нахождения уравнения геодезической линиии применим вариационное исчисление.
Длина линии в геометрии общей теории относительности есть
интеграл по интервалу между двумя событиями разделенными по времени
и пространству:
Линии экстремального пути удовлетворяет условию:
Здесь символ означает первую вариацию. Из этого условия получается уравнение геодезической линии.
Для вычисления вариации величины применим следущий прием.
Проварьируем не дифференциал интервала , а квадрат дифференциала . Вариации самого дифференциала по
вариациям квадрата можно получить согласно уравнению . С другой стороны, вариации
квадрата есть:
правую часть этого равенства можно представить в виде суммы:
Воспользуемся равенствами и и получим уравнение для вариации
дифференциала интервала:
Третий член в круглых скобках уже приведен к виду пригодному для
вычисления первой вариации. Для приведения к такому же виду первых
двух членов воспользуемся равенством:
Воспользуемся теперь этими равенствами и вычислим первую вариацию
полного пути:
В этом уравнении первый член после второго знака равенства
представляет из себя вариации в конечных точках пути, по определению
эти вариации равны нулю [
(5.10) |
Здесь - вектор касательный к геодезической линии.
Уравнение, которое мы получили является уравнением второго порядка. В случае эвклидовой геометрии, когда все компоненты метрического тензора являются диагональными и равны единице, правая часть равенства (5.10) равна нулю. Тогда решение этого уравнения есть . Это решение описывает прямые линии, которые являются линиями кратчайшего пути в эвклидовой геометрии.
Приведем это уравнение к стандартной форме, принятой в
неэвклидовой геометрии. Для этого воспользуемся тождеством:
Подставив его в левую часть уравнения (5.10)
получаем уравнение вида:
Величина
(5.11) |
называется символом Кристоффеля. Символ Кристоффеля имеет три индекса и не является тензором. В алгебре такие величины носят название символы первого рода.
Стандартный вид уравнения геодезической линии в неэвклидовой
геометрии записывается с помощью символа Кристоффеля:
(5.12) |
Кроме этого, стандартного вида уравнения геодезической линии,
можно также записать как меняется дифференциал касательного вектора
при переносе вдоль геодезической
линии:
(5.13) |
Рассмотрим в качестве примера геодезические линии на сфере -
двумерной неэвклидовой поверхности. Метрический тензор на
поверхности сферы имеет вид:
(5.14) |
Контравариантные компоненты метрического тензора на поверхности
сферы есть:
(5.15) |
Вычисляя символ Кристоффеля получаем, что все компоненты равны
нулю за исключением двух:
Уравнения геодезических линий имеют вид:
(5.16) |
и
(5.17) |
Здесь , сферические координаты наклонения и азимута, а - афинный параметр вдоль геодезической линии.
При приведении к первому интегралу уравнение (5.17)
получает вид:
или
(5.18) |
Здесь обозначает константу интегрирования.
Первый интеграл уравнения (5.16)
можно легко привести к удобной форме, если выбрать в качестве
афинного параметра длину вдоль геодезической . Тогда интеграл первого уравнения
становится:
(5.19) |
Рассмотрим два частных случая геодезических линий.
Пусть наша линия начинается на экваторе , причем направление этой линии совпадает с направлением экватора, т.е. и .
Решение для геодезической линии получается из уравнений (5.18,
5.19).
Действительно, правая часть равенства (5.18)
есть 1. Подставляем выражение для в уравнение (5.19)
и получаем уравнение:
Удовлетворяет этому уравнению только значения . Таким образом доказано, что экватор является геодезической линией на сфере.
Рассмотрим теперь движение вдоль меридиана и покажем, что
меридиан также является геодезической линией. Теперь вектор,
касательный к линии имеет компоненты:
Начальную точку также выберем на экваторе . Из уравнения (5.18)
получаем, что
откуда следует, что . Из второго интеграла системы (5.19)
получаем, что
откуда непосредственно следует, что
Не рассматривая общего случая решения системы (5.18, 5.19) упомянем только, что экватор и меридиан на поверхности сферы являются частными случаями большого круга - сечения поверхности сферы плоскостью, которая проходит через центр сферы. Рассматривая трехмерные вращения, можно показать, что только отрезок большого круга на сфере представляет кусок геодезической линии. Полная геодезическая линия представляет из себя большой круг.
Продемонстрируем отличие произвольной линии от геодезической линии на примере малого круга на сфере. Малый круг на сфере - это сечение сферы плоскостью, которая не проходит через центр сферы.
Выберем малый круг так, чтобы он был сечением с . Тогда уравнения, которые описывают
малый круг есть:
отсюда легко найти первые и вторые производные от координат по
афинному параметру:
Подставляя эти значения в уравнения геодезических приходим к
противоречию:
Таким образом малый круг на сфере не является геодезической линией.
7. Тензор кривизны >>
Напомним, что если в каждой точке некоторой области (которое может охватывать и все пространство) задана некоторая скалярная или векторная величина, то говорят, что задано поле этой величины. Аналогично можно задать поле тензорной величины. Скажем метрика Минковского, определяемая как (5.6), является тензорным полем второго ранга, определенным во всех пространстве. Каждая компонента этого поля является постоянной величиной, причем диагональные компоненты отличны от нуля (, ), а недиагональные равны нулю. Примером тензорного поля второго ранга, которое не является постоянным может служить метрика на поверхности сферы. Недиагональные компоненты такой метрики, как и в предыдущем примере, равны нулю, но из диагональных компонент только компонента , тогда как вторая компонента является функцией одной из координат .
В пространстве с эвклидовой или псевдоэвклидовой метрикой в
векторном и тензорном анализе можно определить производные от
соответствующего поля по стандартным правилам:
(6.1) |
В пространстве с эвклидовой метрикой разность двух векторов, даже взятых в различных точках пространства является вектором. Эта разность при линейных преобразованиях координат преобразуется как вектор.
При нелинейных преобразованиях координат или в пространстве с
неэвклидовой метрикой разность двух векторов, взятых в различных
точках пространства преобразуется уже не по закону преобразования
векторов. Хотя подробное изложение правил тензорного анализа можно
найти в прекрасных учебниках [
Вначале покажем, что при нелинейных преобразованиях дифференциал векторного поля уже не является векторным полем.
Итак, введем стандартное обозначение:
аналогичные вычисления проделаем для самого векторного поля:
Все величины теперь вычислены в точке , поэтому можем строить дифференциал
и производную векторного поля по обычным правилам:
а производная этого векторного поля вычисляется как:
Второй член в этом уравнении обладает признаками тензора, преобразуется как тензорное поле второго ранга. Первое слагаемое явно не является тензорным полем, поскольку преобразуется по другим правилам.
Так получилось потому, что мы пренебрегли последовательными рассуждениями в определении производных от векторнорго поля в неэвклидовой геометрии. При вычислении приращения векторного поля мы вычитали величины определенные в разных точках пространства. Первая величина определена в точке , а вторая в точке . В эвклидовой геометрии при вычислении приращения векторного поля обычно опускается промежуточный шаг, который заключается в том, что векторы, заданные в соседних точках, сводятся по определенным правилам в одну точку.
Таким правилом является параллельный перенос. Дифференциал векторного поля, полученный вычитанием значения векторного поля заданного в точке и параллельно перенесенного из точки в точку из значения векторного поля в точке называется ковариантным дифференциалом.
Итак, для получения из тензорного поля ранга путем дифференцирования тензорного поля ранга необходимо вычислять не обычный дифференциал, а ковариантный дифференциал.
Ковариантное дифференцирование тесно связано с понятием параллельного переноса вектора.
Параллельный перенос вектора в эвклидовом пространстве определяется как перенос вдоль некоторой прямой таким образом, что угол между вектором и прямой остается при переносе постоянным. Соответственно, компоненты вектора при таком переносе остаются неизменными.
В неэвклидовой геометрии эта операция несколько изменяется. Аналогом прямой в неэвклидовой геометрии является геодезическая линия. Параллельный перенос вектора определяется как перенос вдоль геодезической линии, которая соединяет две точки. Естественно, как и в эвклидовой геометрии, угол между переносимым вектором и геодезической линией остается постоянным.
В качестве характеристики угла между выбранным вектором, скажем,
и геодезической линией принимем угол
между вектором и вектором касательным к
геодезической линии. Таким вектором является производная от
уравнений геодезической линии по афинному параметру вдоль этой линии
. Угол между и определяется согласно уравнению (5.8).
Пусть норма вектора равна единице
Итак вычислим изменение произвольного вектора при параллельном переносе вдоль
геодезической линии. Основное требонание, налагаемое параллельным
перносом заключается в том, что скалярное произведение вектора и вектора касательного к
геодезической линии является постоянным вдоль линии переноса:
Введем обозначение для изменения компонент вектора при параллельном переносе.
Теперь распишем уравнение сохрания скалярного произведения более
подробно
Преобразуем правую часть уравнения, выделив член нулевого порядка
малости по бесконечно малому смещению и два члена первого порядка
малости, вторым порядком малости здесь будем пренебрегать. Первый
член в правой части сократится с членом, который стоит в левой
части, а два члена первого порядка малости дадут уравнение для
вычисления :
Подставим в это уравнение изменение касательного вектора вдоль
геодезической (5.13)
и получим уравнение для изменения вектора :
Отсюда получаем решение:
В современных [
Ковариантный дифференциал будем обозначать большой буквой латинского алфавита. Ковариантный
дифференциал векторного поля является разностью двух малых
величин. Первая - обычный дифференциал поля между двумя пространственно -
временными точками , вторая величина - изменение
векторного поля при параллельном переносе его из
одной точки пространства в другую.
Контравариантные компоненты от ковариантных отличаются знаком:
Теперь можно написать уравнения для ковариантных дифференциалов
а также уравнения для ковариантных производных от векторов
Легко видеть, что ковариантный дифференциал подчиняется всем основным правилам дифференцирования:
(6.2) | |||
пользуясь этими правилами можно доказать правило образования ковариантных производных от тензоров более высокого ранга чем вектора:
(6.3) | |||
(6.4) | |||
(6.5) | |||
(6.6) | |||
(6.7) |
Обратим внимание, что в случае смещанных индексов порядок может быть важен, в том случае, когда тензор не является симметричным. Тогда указание на то, что индекс должен следовать вторым показано отступом, верхний и нижний индексы не расположены в одной колонке. То же самое справедливо и для символом Кристоффеля.
Теперь можно просто сформулировать словесное правило образования ковари антной производной от тензора любого ранга и содержащего произвольное количество нижних и верхних индексов. Ковариантная производная равняется сумме частной производной от тензора по некоторой координате плюс (или минус) произведения символов Кристоффеля на сам тензор. Количество членов в этой сумме равняется количеству индексов плюс частная производная от самого тензора. Более точно, ковариантная производная от тензора ранга , содержащего верхних и нижних индексов равняется частной производной от этого тензора, плюс произведение символа Кристоффеля (с верхним индексом таким же как один из верхних индексов дифференцируемого тензора и одним из нижних индексов таких же как у координаты, по которой ведется дифференцирование) с самим тензором у которого один из верхних индексов суммируется со вторым индексом символа Кристоффеля, минус произведение символа Кристофферя (теперь верхний индекс у связности является немым индексом суммирования, а один из нижних индексов такой же как у координаты по которой ведется дифференцирование) с самим тензором у которого очередный нижний индекс заменен на нем ой индекс суммирования, а остальные расположены по порядку.
Коваринтные производные подчиняются тем же обычным правилам дифференцирования, которые справедливы для обычных производных от векторных и тензорных полей в эвклидовам пространстве. Эти правила перечислены чуть выше для вариаций вектора (см. уравнение (6.2)).
Добавим, что ковариантная производная от скалярного поля совпадает с обычной производной.
Законы преобразований символов Кристоффеля при преобразованиях
координат имеют вид:
Существует обобщения неэвклидовой геометрии в которой символ
Кристоффеля уже не является симметричным. Разность
называется тензором кручения. В отличие от символа Кристоффеля, который не является тензором и преобразуется по закону, содержащему вторую производную от координат, величина является тензором и, как легко проверить, преобразуется как тензор третьего ранга.
В общей теории относительности тензор кручения равен нулю, эксперименты показывают, что введение этой величины излишне. Поэтому далее мы не будем рассматривать тензор кривизны и его наблюдательные проявления. В общей теории относительности символ Кристоффеля является симметричным по нижним индексам, что выражается уравнением вида . Всюду ниже будем полагать, что является симметричным по индексам .
Для вычисления ковариантных производных в неэвклидовой геометрии необходимо научиться вычислять символы Кристоффеля. Они вычисляются очень просто в метрических пространствах, когда определяется через метрический тензор. Найдем связь с метрическим тензором.
Ковариантный дифференциал является тензором, поэтому согласно
правилу поднятия и опускания индексов в метрических пространствах
можно написать уравнение:
(6.8) |
(6.9) |
Теперь продифференцирум (6.9)
и применим правила (6.2).
Получим уравнение вида
(6.10) |
Из сравнений уравнений (6.8)
и (6.10)
видно, что ковариантный дифференциал от метрического тензора равен
нулю. Следовательно равны нулю ковариантные производные по всем
координатам. Вычислим ковариантные производные в явном виде согласно
уравнению (6.5).
Эти ковариантные производные имеют вид:
(6.11) |
Поскольку левая часть уравнения (6.11)
равна нулю, как это следует из уравнения (6.10),
то и правая тоже равна нулю. В результате получаем линейное
уравнение для связи символов Кристоффеля с метрическим тензором и
его частными производными первого порядка:
(6.12) |
Переставляя индексы в уравнении (6.12) получаем систему линейных уравнений вида:
(6.13) | |||
(6.14) | |||
(6.15) |
Вычитая почленно из уравнения (6.13)
уравнения (6.14)
и (6.15),
получаем уравнение
из которого легко находим связь символов Кристоффеля с
метрическим тензором и его первыми производными по координатам:
(6.16) |
Как видно из уравнения (5.11) эти два символа совпадают.
Рассмотрим теперь ковариантную производную одного из самых важных
для нас векторов - 4 скорости пробной частицы или вектора
касательного к геодезической линии. Ковариантный дифференциал этого
вектора есть:
Теперь можно вычислить частную ковариантную производную по одной
из координат:
в соответствии с общими правилами ковариантного
дифференцирования. Умножим это уравнение на сам вектор 4 скорости:
Первый член в правой части этого уравнения, как легко видеть,
равен полной производной от скорости по афинному параметру вдоль
геодезической линии:
Оба члена вместе представляют уравнение геодезической линии,
откуда имеем еще один вид уравнения геодезической:
(6.17) |
В математическом анализе и геометрии используют еще несколько видов производных. Для нас важными являются две из них, это производная Лагранжа -Эйлера и производная Ли. Вначале познакомимся с производной Лагранжа -Эйлера.
Рассмотрим множество функций координат . Эти функции могут быть компонентами скаляра, вектора или тензора. Они могут быть объектами другой природы, которые преобразуются к другой системе координат по собственным правилам. Для вычисления производной Лагранжа -Эйлера неважна природа этих функций. Мы опустим индекс , но будем помнить, что функции представляют из себя набор функций.
Рассмотрим функцию от аргументов, которые сами являются функциями и их производными:
Еще раз подчеркнем, что в общем случае является множеством функций, а не обязательно одной функцией.
Рассмотрим теперь функционал, например действие от функции :
взятое по некоторой 4 области .
Обозначим вариацию поля и будем считать, что вариации самого поля, а также всех его производных исчезают на границе области .
Вариации функции имеют вид:
Отсюда получаем для вариаций функционала уравнение вида:
Интегрируя каждый из членов в круглых скобках по частям получаем:
Выражение, которое находится в круглых скобках в последней
строчке называется производной Лагранжа -Эйлера. Итак по определению
величина:
называется производной Лагранжа -Эйлера от L. Она тесно
связана c функциональной или вариационной производной вводимой в
теории случайных полей [
Уравнение вида:
называется уравнением Эйлера. Уравнения такого вида являются уравнениями движения в ньютоновской механике. Иногда в качестве величины выступает переменная, которая вообще не преобразуется.
Производная Ли для нас не так важна, как производная Лагранжа - Эйлера, но все же мы кратко проанализируем ее здесь, поскольку будем обращаться к ней несколько раз в течение курса. Более подробно о методе Ли и его применениях будет рассказано ниже.
Производная Ли играет большое значение при исследовании свойств симметрии метрики. Для исследования этих свойств напомним вначале простейшее понятие симметрии, например зеркальной симметрии. Геометрическое тело называют симметричным относительно плоскости, если эта плоскость разбивает тело на две части, из которых каждая является зеркальным отражением другой относительно этой плоскости. Сама плоскость в этом случае называется плоскостью симметрии. Зеркальной симметрией обладают многие предметы из окружающего нас мира: самолет, лист клена, форма человеческого тела (внутреннее строение уже не обладает свойством зеркальной симметрии!).
С формальной точки зрения зеркальную симметрию определяют как
форминвариантность относительно преобразования координат вида:
Если при таком преобразовании координат форма тела остается неизменной, то говорят, что геометрическое тело симметрично относительно плоскости
Отметим, что приведенное выше преобразование не является непрерывным относительно некоторого параметра, как в большинстве случаев, которые мы рассматривали при преобразованиях координат в неэвклидовой геометрии. Поэтому свойства симметрии геометрических тел, точнее функций связаны с инвариантностью при преобразованиях координат. Зеркальная симметрия относиться к так называемым дискретным видам симметрии.
Ниже мы будем рассматривать только точечные виды симметрии. Они связаны с непрерывными преобразованиями, непрерывно зависят от одного или нескольких параметров. К таким видам симметрии относится, например, симметрия относительно вращения. Так, сфера - идеальный объект в трехмерном пространстве для изучения группы вращений. Вращения можно осуществлять на произвольный, сколь угодно малый, угол.
Определим понятие симметрии для метрического тензора. Говорят,
что метрика является форминвариантной
относительно преобразований координат вида , если преобразованная метрика - та же функция от аргумента , что и первоначальная функция от ее первоначального аргумента , т.е. [
Заметим, что это равенство можно также переписать в двух эквивалентных формулировках:
и
Многие геометрические свойства пространства можно определить пользуясь понятиями симметрии. Симметрии пространства также важны для определения физических свойств, законов сохранения, поиска наиболее общих интегралов уравнений движения. Свойства метрики пространства - времени можно определить не прибегая к решению уравнений общей теории относительности, а пользуясь только соображениями симметрии. Поясним как это можно сделать на примере производных Ли.
Производные Ли являются обощениями понятия производных по
направлению на тензоры. Рассмотрим две точки в пространстве и , разделенные малым расстоянием.
Пусть координаты этих точек соединяются бесконечно малым вектором,
квадратом которого можно пренебречь по сравнению с самим вектором
Пусть задано некоторое скалярное поле . Вычислим значение поля в точке если значение этого поля в точке
задано:
Естественно, в этом разложении в ряд Тейлора можно пренебречь
квадратичными поправками и поправками более высоких степеней.
Величина:
(6.18) |
называется производной Ли от скалярного поля. В курсах высшей математики этот оператор чаще называется производной по направлению .
Рассмотрим смысл такой производной на примере скалярного поля, заданного в трехмерном пространстве. Пусть у нас задано цилиндрически - симметричное распределение температуры в пространстве с цилиндрическими координатами , и . Интуитивно понятно, что температура может зависеть от радиуса , но она не будет зависеть от координаты или от координаты . Это означает, что производная от температуры по координатам , равна нулю. В инвариантном виде это означает, что существуют вектора, выделяющие направление вдоль которых производная Ли равна нулю. В данном частном случае это вектора описывающие движения вдоль оси и вокруг нее. В общем случае движение, которое описывает вектор , описывает точечную симметрию, если значение поля в двух точках и вдоль этого вектора является постоянным.
Теперь определим производную Ли для векторного поля . От случая скалярного поля эта
производная отличается тем, что теперь вычисляется величина, которая
зависит от координатной системы. Итак, вновь у нас есть две точки,
которые разделены бесконечно малым вектором . Значения векторного поля в точке
через значения в точке вычисляются как:
Рассмотрим теперь преобразование координат:
где - тот же самый вектор бесконечно
малой величины. Теперь, как нетрудно видеть, точка имеет те же значения координат в
тильдованной системе, что и точка в нетильдованной системе.
Коэффиценты в матрице преобразования векторов для такого
преобразования имеют вид:
Соответственно коэффиценты в матрице преобразования вектора в
точке есть:
или
Запищем теперь значение вектора в точке через значение в точке , тогда получим:
Разница между преобразованными компонентами векторного поля в
точке и непреобразованными компонентами
векторного поля в точке называется дифференциалом Ли или
производной Ли:
(6.19) |
Аналогично можно определить производную Ли для тензорного поля.
Рассмотрим теперь какое - либо тензорное поле, например,
образованное из тензора второго ранга, которое в системе координат
без тильды имеет компоненты . В преобразованной системе координат
оно имеет вид:
Так отличаются компоненты тензора в тильдованной и нетильдованной
системах координат. Теперь вычислим компоненты этого тензора в
точках и .
Окончательно вычислим разницу между значениями компонент тензора
в точке в нетильдованной системе координат и
значениями компонент тензора в точке в тильдованной системе координат.
Эта величина называется производной Ли для тензоров второго ранга:
(6.20) |
Теперь можно определить симметрию тензорного поля относительно векторного поля как равенство нулю производной Ли (6.20).
Вернемся теперь к симметриям метрического тензора. Производная Ли
метрического тензора выглядит особенно просто:
(6.21) |
Это просто проверяется непосредственным вычислением. Равенство
нулю производной Ли дает нам уравнение Киллинга:
(6.22) |
которое определяет симметрии метрического тензора.
8. Уравнение движения в >>
Пусть в нашем пространстве задано векторное поле . Рассмотрим первые производные этого векторного поля и вторые производные поля . Поскольку большинство уравнений математической физики - уравнения содержащие вторые производные от физической величины, то при обобщении уравнений описывающих какое - либо поле, например, электромагнитное, нам придется выводить уравнения, которые содержат вторые производные от полей по координатам. В эвклидовой геометрии порядок производных был неважен, производные обладали свойством коммутации. В неэвклидовой геометрии это свойство, вообще говоря, теряется.
Рассмотрим ковариантные производные второго порядка. Такую
производную можно записать как
(7.1) |
Теперь выпишем разность ковариантных производных меняя индексы по которым ведется дифференцирование.
(7.2) | |||
Проанализируем полученное уравнение. Прежде всего обратим внимание, что в левой части уравнения первая строчка, которая содержит антикоммутатор от частным производных обращается в ноль. Таким образом антикоммутатор ковариантных производных понижает порядок дифференцирования. Вторая строчка содержит первые частные производные от векторного поля. Заметим, что первый и пятый члены взаимно сокращаются, также сокращаются поочередно второй и четвертый, а также третий и шестой члены. Таким образом антикоммутатор ковариантных производных второго порядка не содержит частных производных вообще. Однако, уравнение (7.2) не обращается в ноль тождественно.
Третья строчка полученного уравнения, которая содержит
произведения частных производных от символа Кристоффеля на векторное
поле не обращется в ноль тождественно. В последней строчке взаимно
сокращаются второй и четвертый члены, но первый и третий члены не
сокращаются. Таким образом, получается, что антикоммутатор
ковариантных производных второго порядка равен произведению самого
векторного поля на величину содержащую четыре индекса:
(7.3) |
Теперь легко доказать, что величина является тензором. Действительно,
сделаем преобразование координат из одной системы (скажем, ) в другую . Слева в уравнении (7.3)
стоит тензорная величина третьего ранга (напомним, что первая
ковариантная производная от вектора является тензором второго ранга,
соответственно вторая ковариантная производная от вектора является
тензором третьего ранга). Справа в этом уравнении - произведение
вектора на величину с четырьмя индексами. Сравнивая зависимость в
двух системах координат получаем закон преобразования для в виде:
Это доказывает, что величина является тензором четвертого ранга.
Этот тензор называется тензором кривизны или тензором Римана
(7.4) |
Здесь знаки в определении тензора кривизны выбраны так, чтобы
тензор совпадал с определением принятым в [
В этой части мы рассмотрим второй, традиционный вывод тензора
кривизны. В классических книгах, посвященных неэвклидовой геометрии
и общей теории относительности, тензор кривизны появляется при
обсуждении параллельного переноса вектора по замкнутой кривой (см.
например, [
Итак, рассмотрим параллельный перенос вектора вдоль замкнутой кривой. Для пояснения выкладок вначале выберем двумерную поверхность сферы, а в качестве вектора единичный вектор касательный к траектории переноса в начальной точке. Кривую нарисуем на поверхности сферы и будем считать, что эта кривая - параллель или линия широты.
Метрику в координатах можно записать как (5.9):
Кроме того, выпишем вновь также компоненты символа Кристоффеля на
поверхности единичной сферы:
Вектор переносится вдоль широты на сфере
параллельно. Это значит, что ковариантная производная этого вектора
вдоль выбранной кривой равна нулю. Поэтому формально условие
параллельного перноса записывается как:
Теперь напишем это формальное условие более детально:
(7.5) |
Пусть на параллели, которая характеризуется одним параметром -
координатой , задан вектор единичной длины:
(7.6) | |||
(7.7) |
Вектор переносится вдоль широты, а это значит, что изменение
координаты отсутствует, . Уравнения (7.5)
принимают вид:
(7.8) | |||
(7.9) |
Вначале рассмотрим вспомогательный пример. Сдвинем вектор вдоль широты на расстояние . Его компоненты изменятся. Появится
компонента направленная вдоль первой оси:
а компонента вдоль второй оси останется неизменной (с точностью
до малых величин второго порядка):
Теперь видно, что вектор повернулся ( поскольку появилась
компонента вдоль первой оси). Угол между параллельно перенесенным
вектором и вектором, касательным к широте есть:
Рассмотрим теперь математические операции более подробно и решим
уравнения параллельного переноса вектора для вычисления его
компонент после перенесения на конечное расстояние вдоль широты.
Уравнения (7.8)
становятся:
(7.10) | |||
(7.11) |
Теперь уравнения описывающие параллельный перенос вектора - это
два обыкновенных дифференциальных уравнения. Продифференцируем
второе из уравнений (7.10)
по переменной и подставим его в первое. Получим
одно уравнение второго порядка:
Его решение - это решение уравнения колебаний, когда частота
колебаний равна . Это решение имеет вид:
Естественно, что решение зависит от двух постоянных величин и .
Соответственно решение для первой компоненты вектора получается дифференцированием по и умножением на :
Найдем теперь постоянные и . В точке компоненты вектора есть , . Подставим эти условия в найденные
решения для компонент и получим, что , а . Поэтому решения для компонент
вектора имеют вид:
Найдем угол между вектором и единичным вектором, касательным к
линии широты . Этот угол будет определяться
уравнением:
Проекция вектора на вектор уменьшается по мере переноса вдоль широты. В то же время проекция
вектора на единичный вектор вдоль меридиана,
назовем его растет:
Вектор, касательный к линии меридиана направлен от полюса. Посмотрим на сферу со стороны северного полюса. Пусть перенос осуществляется в направлении против часовой стрелки. Тогда поворот вектора происходит по часовой стрелке.
Рассмотрим более подробно перенос вектора по широте расположенной близко к полюсу. Будем считать, что , и будем пренебрегать членами квадратичными по широте. Тогда . Рассмотрим значения компонент в точке . При этом видно, что компонента, направленная вдоль обращается в ноль, а компонента, направленная вдоль вектора становиться почти единичной. При переносе вдоль широты значительно отстоящей от полюса, компонента вдоль обращается в ноль при значении угла .
При дальнейшем переносе угол между и продолжает расти. После полного
переноса вектора и возвращения его в точку угол между перенесенным вектором и
вектором есть:
Отметим также, что угол между исходным положением вектора и его
конечным положением есть
что в точности равно площади сегмента сферы единичного радиуса, ограниченного линией широты.
Если вектор переносится параллельно самому себе на плоскости вдоль замкнутой кривой, то после возвращения в исходную точку, вектор совпадает сам с собой. В неэвклидовой геометрии это не так. Следовательно геометрия на сфере неэквивалентна геометрии на плоскости. Чуть ниже мы увидим, что выведенные уравнения имеют отношение к кривизне поверхности.
Рассмотрим теперь параллельное перенесение вектора вдоль замкнутой кривой в произвольной неэвклидовой геометрии.
Прежде чем исследовать поведение вектора при параллельном перносе вдоль замкнутой кривой произвольной формы, мы рассмотрим перенос этого вектора вдоль бесконечно малого параллелограмма построенного на отрезках соответствующих координат.
Итак, пусть у нас задан вектор . Вершины параллелограмма обозначим (см. рис. 7.1). Точку и точку соединяет бесконечно малый вектор . Точку и точку соединяет бесконечно малый вектор . Поскольку наша фигура - параллелограмм, то стороны, противоположные сторонам и соединяют вектора полученные параллельным переносом. Сторона, которая построена на векторе соединяющем точки и , противоположна стороне построенной на векторе . Этот вектор, параллельно перенесенный на , есть . Сторона, которая построена на векторе, соединяющем точки и , противоположна стороне, построенной на векторе . Этот вектор, параллельно перенесенный на , есть . Таким образом мы вычислили размер сторон параллелограмма.
Вычислим теперь изменение компонент вектора при перенесении. Пусть вектор заданный в точке переносится параллельно самому себе вначале через точку в точку , а затем из точки через точку в точку .
Рассмотрим вначале перенос из в через точку . Величина вектора, перенесенного в
есть:
Теперь этот вектор должен быть перенесен из точки в точку . Но в точке значения символов Кристоффеля уже
другие:
После перенесения из точки в вектор вновь изменяется.
Следовательно вектор, перенесенный из в через имеет вид:
Здесь мы пренебрегли величинами третьего порядка малости.
Для вектора перенесенного из в через точку получаем аналогичное выражение, в
котором вектора и меняются местами. Теперь можно
вычислить разность между двумя векторами, перенесенными в по двум траекториям. Эта разность
равна:
(7.12) |
Это выражение является вектором, так как построена как
алгебраическая сумма векторов. Другими словами, выражение, которое
стоит в фигурных скобках, является тензором четвертого ранга. Этот
тензор:
(7.13) |
называется тензором кривизны. Поэтому пространство является эвклидовым, если (7.13) равен нулю в каждой точке этого пространства.
Произведение двух векторов на которых построен параллелограмм есть площадь этого бесконечно малого параллелограмма.
Рассмотрим теперь изменение вектора при параллельном переносе вдоль замкнутой кривой конечного размера. Разобъем ее на бесконечно малые параллелограммы, как показано на рис. 7.2
Теперь можно получить изменение компонент вектора при параллельном перносе вдоль
замкнутой кривой конечных размеров в виде интеграла по поверхности,
стягиваемой этой кривой:
Свойства тензора кривизны мы уже немного обсудили при анализе второй ковариантной производной от вектора. Обсудим алгебраические свойства тензора кривизны более подробно. Для этого опустим верхний индекс и будем работать только с ковариантным тензором четвертого ранга.
Из уравнения (7.4) следуют свойства симметрии тензора кривизны:
(7.14) | |||
(7.15) | |||
(7.16) | |||
(7.17) |
До сих пор мы рассматривали общий случай неэвклидовой геометрии, теперь вспомним, что нам нужено только четырехмерное пространство. В этом случае пары индексов и пробегают 6 различных наборов значений. Поэтому есть 6 компонент тензора кривизны с одинаковыми и компонент с различными значениями индексов. Три компоненты с четырмя различными индексами связаны уравнением (7.17), поэтому всего имеется 20 независимых компонент.
Существует одно дифференциальное тождество, которое называется
тождеством Бьянки:
(7.18) |
Из тензора кривизны четвертого ранга образуются дополнительно две
величины. Одна является тензором второго ранга и образуется сверткой
верхнему и второму нижнему индексам:
(7.19) |
Тензор Риччи является симметричным тензором, поэтому в четырехмерном пространстве он имеет 10 независимых компонент (как и метрический тензор). Сверткой по оставшимся двум индексам можно получить скалярную величину, которая называется скалярной кривизной пространства:
(7.20) |
Поскольку (7.20) является скалярной величиной, то она является одновременно инвариантной относительно координатных преобразований и называется также скалярной кривизной пространства.
Из тождеств Бьянки можно получить важное равенство. Для этого
свернем тождество (7.18)
по индексам . Тогда получим уравнение вида:
Свернем это уравнение еще раз с метрическим тензором, получим
равенство:
(7.21) |
В этом уравнении четырехмерная дивергенция некоторого тензора
второго ранга равна нулю. Этот тензор:
(7.22) |
играет важную роль в общей теории относительности. Иногда его называют тензором Эйнштейна.
Рассмотрим теперь изменение символов Кристоффеля, а также тензоров кривизны, Риччи и скалярной кривизны при вариациях метрики. Полученные уравнения мы будем использовать в дальнейшем как для вывода уравнений гравитационного поля, так и для анализа слабого гравитационного поля и слабого гравитационного поля на фоне сильного поля.
Пусть у нас есть метрика , на которую наложены небольшие
изменения, которые мы будем обозначать и которые являются вариациями
метрики. Отметим, что эти две величины по отдельности образуют
тензора. Тем не менее сейчас мы будем рассматривать как один тензор,
который состоит из "фоновой" метрики и малых поправок:
(7.23) |
Все величины, которые мы будем вычислять ниже, будем вычислять только до первого порядка малости по вариациям, пренебрегая вкладом вариаций более высокой степени.
Рассмотрим как связаны вариации контравариантных компонент
метрического тензора с вариация ковариантных компонент.
Контравариантные компоненты метрического тензора удовлетворяют
равенству вида:
Подставляя сюда ковариантный метрический тензор с вариациями и конравариантные компоненты получаем связь между
контравариантными и ковариантными вариациями:
(7.24) |
Отсюда видно, что конравариантные вариации отличаются от ковариантных знаком, а индексы поднимаются метрическим тензором, как и у любых других тензоров.
Для вычисления вариации определителя метрического тензора введем
абсолютно антисимметричный единичный тензор четвертого ранга [
Теперь можно легко вычислить вариации определителя метрического тензора.
Вариации определителя с точностью до линейных по членов есть:
Приведем также одну полезную формулу, содержащую вариации
плотности метрического тензора:
В этих двух уравнениях опущен индекс в символах фоновой метрики, но поскольку мы договорились оставлять только линейные члены по вариациям, легко определить величины содержащие этот индекс.
Рассмотрим теперь вариации символов Кристоффеля. Вновь оставляя
только линейные члены по получаем уравнение для вариаций
символов Кристоффеля:
(7.25) |
Отметим, что вариации символов Кристоффеля по отношению к "фоновой" метрике являются тензорами третьего ранга. Ковариантные производные построены с помощью фоновой метрики .
Вариации тензора Риччи выражаются через ковариантные производные
нового тензора - вариации символов Кристоффеля :
(7.26) |
Это уравнение можно переписать в терминах вариаций метрики, в них
оно имеет вид:
(7.27) |
Поскольку инертная масса тела равна его гравитационной массе (это формулировка принципа эквивалентности, многократно проверенного экспериментально), то движение пробной частицы не зависит от массы этой частицы - перо птицы и кирпич падают в гравитационном поле с одинаковым ускорением (конечно, если пренебречь сопротивлением воздуха).
В общей теории относительности роль гравитационной силы играет кривизна пространства - времени. Движение в гравитационном поле - это движение в искривленном пространстве, отклонение от движения по прямой линии - это отклонение в движении возникающее в искривленном пространстве времени.
Вспомним вначале уравнения движения в специальной теории относительности.
В специальной теории относительности уравнение движения пробной
частицы имеет вид:
(8.1) |
где - 4 скорость частицы (физическое определение) или вектор, касательный к траектории частицы (математическое определение). Отметим, что - величина безразмерная, а имеет размерность [см]. Другими словами, слева стоит величина, которая имеет размерность силы г .
Уравнения движения электрона в электромагнитном поле имеют вид:
(8.2) |
Сила, которая стоит в левой части уравнения является 4 инвариантной силой Лоренца, построенной из тензора Максвелла .
В случае, когда действующие силы равны нулю , то движение частицы происходит по
инерции. Тогда решение уравнения 8.1
имеет тривиальный вид:
(8.3) | |||
(8.4) |
Движение по инерции - это движение по прямой линии. Прямая линия является линией кратчайшей длины между двумя точками в эвклидовой и псевдоэвклидовой геометрии. В неэвклидовой геометрии линия кратчайшей длины называется геодезической линией. Движение в случае, когда внешние силы равны нулю, в неэвклидовой геометрии заменяется общековариантным уравнением - движением по геодезической линии.
Отметим также, что решение (8.3) описывает также движение фотона, если полагать, что - единичный вектор в направлении распространения фотона, а - афинный параметр вдоль траектории.
Движение по геодезической линии описывает движение пробной частицы в гравитационном поле. Это движение является аналогом движения по инерции в пространстве с эвклидовой метрикой.
Выпишем уравнение движения в общей теории относительности, просто
написав ковариантное обобщение уравнения 8.1:
(8.5) |
Здесь , как мы договорились выше, являются
обозначением ковариантного дифференциала. Поэтому уравнения движения
в общей теории относительности можно написать более детально в виде:
(8.6) |
Заметим, что теперь уравнения движения являются нелинейными (по скоростям), второй член в левой части уравнений содержит квадратичные произведения скоростей.
Теперь уравнения движения, например, электрона в электромагнитном
поле имеют вид:
(8.7) |
Здесь - тензор электромагнитного поля, а и масса и заряд электрона соответственно.
Отметим, что теперь движение пробной частицы в отсутствии внешних сил уже не является движением по прямым линиям, как это было в эвклидовой геометрии (8.3). Движение в отсутствии внешних сил представляет из себя систему дифференциальных уравнений второго порядка для всех четырех координат, которые описывают четырехмерную траекторию пробной частицы.
Рассмотрим уравнения движения пробных частиц, написанные в
трехмерном виде. Будем считать, что частица является
нерелятивистской (т.е. интервал между двумя событиями: выходом
частицы из точки и появление частицы в точке не равен нулю). Уравнения движения
пробных частиц - уравнения геодезических линий имеют вид (8.6).
В качестве афинного параметра вдоль геодезической возмем - интервал между событиями (т.к. он
не равен нулю). Кроме того, напомним, что 4 скорость - это единичный вектор
касательный к траектории движения, по определению:
Это значит, что уравнения движения можно переписать в виде,
который содержит ускорения (вторую производную от координаты частицы
по афинному параметру):
(8.8) |
Преобразуем вторую производную от координаты с пространственным индексом по интервалу к второй производной по координате с нулевым индексом:
Здесь - нулевая компонента 4 скорости, а - 4 мерное уравнение движения с индексом 0.
Это уравнение можно обратить, получая уравнения для ускорений
пробной частицы в виде:
Подставим в это уравнение выражение для
и
После завершения всех выкладок, окончательно получаем уравнение
движения в виде:
До сих пор дифференцирование проводилось по координате с нулевым
индексом, поскольку эта координата имеет такую же размерность как и
остальные координаты [см]. Однако, для получения обычного
трехмерного уравнения движения необходимо перейти к
дифференцированию по времени . Умножим обе части полученного
уравнения на квадрат скорости света и получим уравнение движения в
обычном трехмерном виде:
(8.9) |
Сравнивая обычное уравнение движения в ньютоновской гравитации:
можно сделать вывод о том, что аналогом ньютоновской силы
является член вида:
Из приведенного уравнения видно, что (8.9) содержит члены разных порядков по отношению характерной скорости движения пробной частицы к скорости света. Самый большой член - сила Ньютона, но существуют и более слабые силы, которые, тем не менее вносят вклад в движение частицы в гравитационном поле. Они называются постньютоновскими поправками.
Более полный анализ уравнений движения, в частности вклада постньютоновских поправок мы проделаем позже.
Девиацией двух бесконечно близких геодезических линий называется отклонение этих линий между собой.
Рассмотрим две бесконечно близкие геодезические линии. Одна линия характеризуется несколькими параметрами. Выберем два из них. Один параметр назовем , он будет афинным параметром вдоль линии. Второй параметр выберем так, чтобы он отсчитывался вдоль направления вектора, который соединяет две указанные геодезические линии и является перпендикулярным вектору, касательному первой геодезической линии. Этот параметр назовем . Теперь уравнение геодезической являетмя функцией двух параметров . Первый параметр отчитывает длину вдоль геодезической, второй параметр отсчитывает "номер" геодезической линии, координату в перпендикулярном направлении.
Вектор касательный к траектории геодезической линии, как прежде
будем обозначать . Введем второй вектор , который будет касательным к линии,
соединяющие две геодезические. Отметим полезное равенство:
Докажем еще одно равенство, важное для наших рассуждений.
Рассмотрим ковариантную производную от вектора вдоль геодезической:
Спомним теперь, что вектор . Поскольку можно поменять частные
производные местами, то производную от вектора по параметру можно записать, как производную от
вектора по параметру . Поэтому можно продолжить верхнее
равенство как:
Теперь выпишем само равенство, которое было доказано:
(8.10) |
Рассмотрим теперь как меняется вектор вдоль геодезической линии. Поскольку длина этого вектора является расстояние между геодезическими, то сам вектор показывает как меняется расстояние и ориентация двух пробных частиц, которые движутся по геодезическим линиям в гравитационном поле. В обычной ньютоновской теории тяготения, изменение расстояния между пробными частицами вызывается приливными силами. Найдем аналог приливных сил в ньютоновской механики в общей теории относительности.
Для этого рассмотрим вначале первую ковариантную производную от
вектора вдоль геодезической:
Поскольку производная по параметру может быть выражена как производные по координатам, умноженные на вектор вдоль геодезической. Точно так же можно выразит и вторую производную.
Рассмотрим теперь вторую производную от вектора вдоль геодезической:
В этом равенстве прием перехода от дифференцирования по афинному
параметру к дифференцированию по координатам применен дважды.
Воспользуемся также равенством (8.10) и
выразим величину в круглых скобках через производную от вектора
касательного к геодезической, тогда получим:
В первом члене меняем порядок ковариантного дифференцирования:
а ко второму вновь применяем равенство (8.10).
Получаем, что вторая ковариантная производная от вектора есть:
Обратим внимание на то, что в тензоре кривизны изменен порядок индексов, поэтому и знак перед тензором поменялся. Первый член равен нулюб в силу уравнения геодезической линии (см. (6.17)).
Поэтому окончательно вторая ковариантная производная от вектора
равна:
(8.11) |
Умножая это уравнение на величину - расстояние между геодезическими получаем уравнение для вектора, который соединяет две пробные частиц, которые свободно движутся по двум близким геодезическим линиям.
Это уравнение называется уравнение девиации близких геодезических линий.
Гравитационную силу от произвольного распределения масс можно
получить взяв интеграл по плотности. Однако, чаще в теоретической
физике вводят понятие гравитационного потенциала , с помощью которого уже вычисляют
гравитационную силу действующую на пробную частицу:
Гравитационный потенциал создается распределением масс и
уравнение для потенциала имеет вид уравнения типа скалярного поля. В
отличие от современных уравнений скалярного поля, уравнения
ньютоновского гравитационного поля не являются релятивистски
инвариантными, поскольку гравитационная теория Ньютона существенно
нерелятивистская теория. Поэтому уравнения поля есть уравнение типа
Пуассона:
(9.1) |
Естественно, что ньютоновские уравнения гравитационного поля не могли быть согласованы с принципами релятивистской физики. Потребовалось создание новой теории гравитации - общей теории относительности.
После создания специальной теории относительности А.Эйнштейн начал разработку идей связанных с распространением принципа относительности на ускоренные системы отсчета. Достаточно скоро стало понятно, что невозможно распространение принципа относительности на ускоренные системы отсчета без обсуждения гравитационного поля.
Первая статья [
В следущем параграфе А.Эйнштейн делает вывод о том, что
гравитационное поле надо, по - видимому, характеризовать переменной
скоростью света:
Следущую важную работу, посвященную гравитации, А.Эйнштейн
опубликовал только в 1912 г [
В следущей статье, опубликованной в том же 1912 году А.Эйнштейн
учитывает вклад энергии самого гравитационного поля в гравитационное
поле и впервые получает нелинейное уравнение вида:
Уравнения гравитационного поля становятся нелинейными.
В следущем 1913 г. А.Эйнштейн в совместной статье с М.Гроссманом
[
Окончательно релятивистские уравнения гравитационного поля были
выведены в 1916 г. В статье, опубликованной в "Анналах физики" [
Весьма скоро после начала работы над общей теорией относительности, А.Эйнштейн понял значение гамильтонова подхода для вывода уравнений поля. Этот подход оказался очень плодотворным в современной теоретической физике. Он связан с понятием экстремума действия и принципом наименьшего действия. Именно таким образом мы и будем выводить уравнения гравитационного поля.
Уравнение (9.1)
является существенно нерелятивистским урапвнением. Это легко
показать. Решением уравнения (9.1)
является интеграл:
любые изменения в источнике ( зависит от времени) могут быть мгновенно обнаружены (здесь мы опускаем проблемы связанные с обнаружением сигнала) в тот же момент времени и на любом расстоянии от источника. Это прямо противоречит постулату о невозможности передачи информации со скоростью превышающей скорость света.
Изменить это уравнение на релятивистское крайне просто.
Необходимо добавить вторую производную по времени, превратив
уравнение Пуассона в уравнение д'Аламбера:
(9.2) |
Слева в уравнении теперь стоит релятивистски инвариантный оператор, который обеспечивает релятивистскую инвариантность. Справа должен стоять источник поля (плотность), обладающий такими же свойствами как и поле. Если поле описывается скалярной величиной, то и источник поля также должен быть скалярной величиной. Если гравитационное поле описывается тензором ранга , то и источник должен быть тензором ранга .
Поскольку одноименные заряды в гравитации притягиваются ( в
отличие от электромагнитной теории, в которой одноименные заряды
отталкиваются ), то гравитационное поле должно описываться
тензором четного ранга - скалярным полем, полем тензора второго
ранга и т.п.
Поэтому при релятивистском обобщении ньютоновской теории гравитации, определяемой уравнением (9.2), необходимо определить тензорные свойства источника поля. Величина может быть нерелятивистским пределом либо тензора энергии - импульса , либо скалярной величины - следа этого тензора . В первом случае гравитационное поле представляется тензором второго ранга, во втором случае - тензором первого ранга. Эксперимент показывает, что справедлива теория гравитации с полем второго ранга в качестве полевой переменной.
Итак мы должны найти связь между метрическим тензором и распределением масс, которая
заменит уравнение (9.1)
классической ньютоновской теории тяготения. Рассмотрим вывод
уравнений гравитационного поля в общей теории относительности (
уравнений Эйнштейна ) используя принцип наименьшего действия.
Уравнения гравитационного поля получатся вариацией действия по
метрическому тензору - полевой переменной. Это действие, как и для
полей другого вида должно быть представлено в виде некоторого
скаляра, который является интегралом по 4 пространству от некоторой скалярной
плотности, зависящей от метрического тензора и первых производных
метрического тензора. Такой скалярной плотностью является только
величина:
образуемая из скаляра кривизны. Действие гравитационного поля можно,
следовательно, представить в виде:
(9.3) |
Здесь -некоторая новая гравитационная постоянная. Определить ее связь с кавендишевой гравитационной постоянной с точностью до безразмерного постоянного множителя достаточно просто - действие имеет размерность энергии, скаляр кривизны имеет размерность см, а объем при интегрировании см. Отсюда из соображений размерности находим, что , где - гравитационная постоянная Кавендиша.
Скалярная кривизна наряду с метрическим тензором и его первыми производными содержит также и вторые производные от метрического тензора. Применяя к производную Эйлера - Лагранжа можно получить уравнеия гравитационного поля. Прямые вычисления очень трудоемкие и содержат большое количество выкладок. Мы несколько упростим вычисления, для чего воспользуемся двумя свойствами скаляра кривизны.
Первый прием при выводе уравнений гравитационного поля впервые
применили [
Слева стоит скалярная величина
Кроме того, полную дивергенцию по теореме Остраградского можно
преобразовать в интеграл по трехмерной гиперповерхности. При
вычислении вариаций этот член будет равен нулю, так как по
определению вариации на гиперповерхности, охватывающей объем равны
нулю. Поэтому вариация гравитационного действия равна:
Найдем величину , которая определяет действие гравитационного поля и вычислим ее вариацию относительно метрического тензора.
Скалярная плотность кривизны выражается через метрический тензор
и символы Кристоффеля как:
Находим величины
и
Производная Эйлера - Лагранжа величины определяет уравнения гравитационного поля.
Производная Эйлера - Лагранжа от величины определяется как:
Как видно из определения, зависит от самого метрического тензора и символов Кристоффеля. Вычислим частные производные от и по метрическому тензору .
Для вычисления частных производных от контравариантного
метрического тензора по ковариантному метрическому
тензору воспользуемся равенством вида:
беря частную производную по ковариантному метрическому тензору по
частям получаем уравнение вида:
в этом уравнении достаточно трудно усмотреть симметрию по паре
индексов и . Для того, чтобы сделать эту
симметрию явной, образуем симметричную сумму в правой части этого
равенства, тогда частная производная будет равна:
Для вычисления частной производной от корня из детерминанта воспользуемся равенством:
тогда получаем
Частные производные от плотности действия по ковариантному метрическому
тензору формируются только из частных
производных от контраваиантных компонент метрического тензора , которые входят в символы
Кристоффеля и в определитель . Производные от символа Кристоффеля
есть:
Выпишем теперь частную производную от плотности гравитационного
действия по метрическому тензору:
Несмотря на громоздкий вид структура этой формулы достаточна простая.
Более сложной является структура частной производной от гравитационного действия по производной от метрического тензора. Рассмотрим теперь ее.
Рассмотрим как происходит дифференцирование функции по производной метрического тензора, скажем, . Поскольку производные от метрического тензора по координатам содержатся только в символах Кристоффеля , то и частная производная будет действовать только на эти члены. Только для этих вычислений будем использовать латинские индексы в обозначениях метрического тензора. Только в этом параграфе будем считать, что они пробегают значения 0, 1, 2, 3.
Выпишем частную производную от символов Кристоффеля по нашей
динамической переменной - частной производной от метрического
тензора по одной из координат:
Подставим эту формулу в выражение для частной производной от
плотности гравитационного действия по нашей динамической переменной
- частной производной от метрического тензора по одной из координат
получим некоторое громоздкое выражение. Не выписывая его здесь
целиком, свернем по мертвым индексам суммирования, что значительно
упростит запись:
В этом уравнении введен новый тензор четвертого ранга
В производную Эйлера - Лагранжа член вида
входит не самостоятельно, в от него вычисляется частная
производная по координате, которая стоит в динамической переменной -
частной производной от метрического тензора по координате
После вычисления частных производных по координате появляются производные от символов
Кристоффеля по координатам:
Частные производные от символов Кристоффеля входят в тензор кривизны. Этот тензор имеет ранг 4. Но производные, которые появлись в приведенной выше формуле входят в тензор Риччи. Запишем эту формулу через тензор Риччи .
Выражая частные производные от символов Кристоффеля через тензор
Риччи получим член в левой части равенства вида:
Выражая тензор в виде произведений метрического
тензора и свертывая по индексам суммирования получаем член вида:
Оставшиеся четыре члена представляют произведения символов
Кристоффеля, окончательно выпишем производную от гравитационного
действия в виде:
Выпишем окончательно производную Эйлера - Лагранжа от плотности
гравитационного действия:
Для упрощения дальнейших выкладок выберем систему координат, в
которой удовлетворяется условие во всем пространстве - времени.
Поскольку это только одно условие, то его можно удовлетворить
подходящим выбором системы координат всегда. Доказательство этого
утверждения не входит в наш курс. Следствием этого выбора является
уравнение:
справедливое для любого значения индекса . Тогда первый член в этом уравнении обращается в нуль.
Подставим уравнение для производной Эйлера - Лагранжа в вариацию
действия:
Свертка второго и третьего членов с вариацией метрического
тензора дает нуль, поскольку это сумма
второго и третьего членов антисимметрична по индексам . В результате вариация
гравитационного действия по метрическому тензору равна:
Заметим, что знак минус в последнем равенстве появляется,
поскольку вариации контравариантных компонент метрического тензора
противоположна вариациям ковариантных компонент:
Из вариации действия гравитационного поля сразу можно получить
релятивистские уравнения поля в пустом пространстве:
(9.4) |
Это уравнение эквивалентно уравнению:
в ньютоновской теории гравитационного поля.
Вариация гравитационного действия вычислена в определенной системе координат, которая удовлетворяет условию . Однако, уравнения гравитационного поля получены в общековариантном виде, который справедлив независимо от выбора системы координат.
Для вывода релятивистских уравнений, которые связывают гравитационное поле и распределение материи необходимо найти величину, которая получается при вариации плотности действия от материи по метрическому тензору.
Прежде чем перейти в выводу уравнений общей теории относительности, которые связывают распределение гравитационного поля (метрического тензора) с распределением материи приведем еще один вывод вариации действия гравитационного поля, который является общековариантным и не требует привлечения специальной системы координат. При этом, вывод уравнений релятивистской гравитации методом Паллатини является экономным с точки зрения выкладок.
Уже в предыдущем параграфе читатель мог обратить внимание на то, что вывод уравнений гравитационного поля был отягощен многими предположениями, в частности о выборе специальной системы координат. Это - необходимое следствие общей ковариантности теории. Если в теории, например, электромагнитного поля, вычисление амплитуд потенциала и их производных по времени и координатам достаточно, чтобы полностью определить эволюцию поля, то в общей теории относительности изменить значения метрического тензора и его производных можно с помощью координатного преобразования. Координатное преобразование метрического тензора не несет никакой физической нагрузки, оно целиком зависит от соображений удобства вычислений. Поэтому необходимо выделить ту часть в метрическом тензоре, которая обуславливает динамическую эволюцию.
Эта проблема возникла потому, что в метрическим тензоре содержатся дополнительные степени свободы для того, чтобы обеспечить правильное поведение его компонент при координатных преобразованиях. Дополнительные степени свободы подчиняются некоторым связям, которые необходимо учитывать при выводе уравнений поля.
В современной теории поля разработан метод, который позволяет
отделить динамическую часть от части не несущей физической
информации [
Для получения этого формализма в общей теории относительности
необходимо записать плотность действия в линейном относительно
первых производных виде (этот вид называется записью в форме
Паллатини). Обычный интеграл действия:
дает уравнения общей теории относительности при варьировании
метрического тензора . Получившиеся уравнения Эйлера
являются дифференциальными уравнениями в частных производных второго
порядка относительно метрического тензора. Однако, те же уравнения
можно привести к каноническому гамильтонову виду:
Для этого представим плотность лагранжиана гравитационного поля в
форме Палатини, при этом символы Кристоффеля рассматриваются как
независимые переменные:
(9.5) |
где
Здесь следует отметить, что ковариантные компоненты тензора Риччи
не содержат метрического тензора, а содержат только бинарные
произведения символов Кристоффеля и их производных по координатам.
Варьируя (9.5)
по метрическому тензору получаем уравнения Эйнштейна:
(9.6) |
Дополнительно к этим уравнениям получаем уравнения связи, которые
устанавливают соотношения между независимыми величинами и :
решая эти уравнения относительно величин получаем обычную зависимость между
символами Кристоффеля и метрическим тензором:
В предыдущем параграфе получены уравнения общей теории
относительности в вакууме. Полные уравнения должны содержать также
влияние материи на гравитационное поле. Они должны содержать
источник гравитационного поля. Полное действие для системы
гравитационное поле + материя представляет из себя сумму двух
членов: действия для гравитационного поля и действие для материи . Полные уравнения поля получаются
как сумма вариаций действия для поля и действия для материи:
Вариации производятся по метрическому тензору, а сами уравнения
получаются из приравниванием к нулю первых производных Эйлера -
Лагранжа от действия по метрическому тензору:
(9.7) |
Вариация от действия гравитационного поля по метрическому тензору
есть (9.6):
Вариации от по метрическому тензору называются
тензором энергии - импульса:
(9.8) |
Окончательно, уравнения гравитационного поля в общей теории
относительности имеют вид:
(9.9) |
Здесь постоянную определяют из того условия, чтобы в пределе слабых полей и медленных движений уравнения общей теории относительности совпадали с уравнениями Ньютона для гравитационного поля.
Приведем несколько примеров тензора энергии - импульса.
Тензор энергии - импульса свободной частицы есть:
(9.10) |
Тензор энергии - импульса идеальной жидкости есть:
(9.11) |
Здесь - плотность частицы в первом примере и плотность жидкости во втором примере, - давление в жидкости во втором примере.
| ||||||||||||