Size: a a a

2020 October 20

OI

Oleg Ivchenko in Data Engineers
Aliaksandr Heleisha
Ребята, всем привет. Нужна помощь. Caused by: org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Permissions incorrectly set for dir /tmp/hadoop/nm-local-dir/nmPrivate, should be rwx------, actual value = rw-rw-rw-        Мне кажется я уже пробывал все что предлагали на стековерфлоу.
А просто сделать hdfs dfs -chmod 766 на эту папку не помогает? При каждой новой джобе права сбрасываются?
источник

AH

Aliaksandr Heleisha in Data Engineers
Oleg Ivchenko
А просто сделать hdfs dfs -chmod 766 на эту папку не помогает? При каждой новой джобе права сбрасываются?
Все так. При каждом старте права сбрасываются
источник

OI

Oleg Ivchenko in Data Engineers
Aliaksandr Heleisha
Все так. При каждом старте права сбрасываются
Ошибка связана скорее с YARN, советую в yarn-site посмотреть, правильно ли yarn.nodemanager.local-dirs выставлен.
источник

AH

Aliaksandr Heleisha in Data Engineers
Oleg Ivchenko
Ошибка связана скорее с YARN, советую в yarn-site посмотреть, правильно ли yarn.nodemanager.local-dirs выставлен.
<configuration>
 <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
      <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>  
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>C:/hadoop-2.8.0/yarn/local</value>
</property>
<property>
<name>yarn.nodemanager.log-dirs</name>
<value>C:/hadoop-2.8.0/yarn/logs</value>
</property>

<!-- Site specific YARN configuration properties -->

</configuration>
источник

OI

Oleg Ivchenko in Data Engineers
Aliaksandr Heleisha
<configuration>
 <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
      <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>  
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>C:/hadoop-2.8.0/yarn/local</value>
</property>
<property>
<name>yarn.nodemanager.log-dirs</name>
<value>C:/hadoop-2.8.0/yarn/logs</value>
</property>

<!-- Site specific YARN configuration properties -->

</configuration>
А эти директории существуют в файловой системе?
источник

AH

Aliaksandr Heleisha in Data Engineers
Oleg Ivchenko
А эти директории существуют в файловой системе?
Была ошибка. Забыл версию на 3.1.3 поменять. Но суть не меняется org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Failed to setup local dir C:/hadoop-3.1.3/yarn/local, which was marked as good.       Я выдаю пермишены вручную, но после старта они сбрасываются
источник

OI

Oleg Ivchenko in Data Engineers
Aliaksandr Heleisha
Была ошибка. Забыл версию на 3.1.3 поменять. Но суть не меняется org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Failed to setup local dir C:/hadoop-3.1.3/yarn/local, which was marked as good.       Я выдаю пермишены вручную, но после старта они сбрасываются
Ок, тогда такой вопрос, диск С под NTFS?
источник

AH

Aliaksandr Heleisha in Data Engineers
Oleg Ivchenko
Ок, тогда такой вопрос, диск С под NTFS?
Проблема в том, что у меня только один диск - SSD.
источник

SD

Serg D. in Data Engineers
Ребят, всем привет. Нужна помощь, не могу разобраться. Есть spark, он генерит dataframe и должен сохранить его в виде parquet файла как партицию hive external table.

write.mode(sm).partitionBy(partitions: _*).format("parquet").save(path)

Сам механизм сохранения уже давно работает в приложении. Добавилась новая таблица/новый датафрейм. Код отрабатывает, исключений нет, но по факту файл не создается. Никаких сообщений или ошибок в логах не вижу. Схемы сверил, различий не вижу. Где еще можно поискать причину?
источник

N

Nikita Blagodarnyy in Data Engineers
данных нет в дф?
источник

SD

Serg D. in Data Engineers
Есть. пробовал добавить show
источник

SD

Serg D. in Data Engineers
Вообще, если к примеру будут  не совпадать схемы, тип данных ряда столбцов, например. Что должно произойти? Будет ошибка?
источник

OI

Oleg Ivchenko in Data Engineers
Aliaksandr Heleisha
Проблема в том, что у меня только один диск - SSD.
Если NTFS, то больше идей нет.
источник

N

Nikita Blagodarnyy in Data Engineers
Serg D.
Вообще, если к примеру будут  не совпадать схемы, тип данных ряда столбцов, например. Что должно произойти? Будет ошибка?
не совпадать с чем?
источник

SD

Serg D. in Data Engineers
Есть hive external table, у нее есть определенная схема: имя столбца + тип данных. Если вдруг при записи датафрейма у него будут не совпадать имена таблиц или тип данных.  
Короче опытным путем выяснено, что ошибок не будет. При отличии типов данных может возникнуть ошибка при чтении данных через hive, например.
источник

S

Stanislav in Data Engineers
Serg D.
Ребят, всем привет. Нужна помощь, не могу разобраться. Есть spark, он генерит dataframe и должен сохранить его в виде parquet файла как партицию hive external table.

write.mode(sm).partitionBy(partitions: _*).format("parquet").save(path)

Сам механизм сохранения уже давно работает в приложении. Добавилась новая таблица/новый датафрейм. Код отрабатывает, исключений нет, но по факту файл не создается. Никаких сообщений или ошибок в логах не вижу. Схемы сверил, различий не вижу. Где еще можно поискать причину?
Файл не создаётся? Или не виден в хайве?
источник

SD

Serg D. in Data Engineers
Не создается
источник

S

Stanislav in Data Engineers
Msck repair сделан?
источник

S

Stanislav in Data Engineers
Точно в path нет?
источник

SD

Serg D. in Data Engineers
Stanislav
Msck repair сделан?
Я не знаю что это) Новенький в этой теме. Вообще у меня с двумя таблицами такая проблема. В одной нашел не соответсвие имен, она стала сохраняться. Вторую сейчас построчно сверил, все сходится, включая типы данных, но не сохраняется файл.
источник