Я пытаюсь использовать Bazel для создания обслуживания тензорного потока из https://github.com/tensorflow/serving на CentOS 7.3. Моя версия gcc 4.8.5, bazel версия 0.10.1. Я уверен, что следовал введению в установку и настроил все необходимые предварительные условия. Каждый раз, когда я запускаю команду:
bazel build -c opt tenorflow_serving / model_servers / …
он будет работать около 10 ~ 15 минут и позже остановлен из-за ошибки:
ERROR:
/root/.cache/bazel/_bazel_root/2d16d9349bff8cf3d8fc4a53d2a23056/external/org_tensorflow/tensorflow/core/kernels/BUILD:3120:1: C++ compilation of rule '@org_tensorflow//tensorflow/core/kernels:conv_ops' failed (Exit 4)
gcc: internal compiler error: Killed (program cc1plus)
Please submit a full bug report,
with preprocessed source if appropriate.
See <http://bugzilla.redhat.com/bugzilla> for instructions.
INFO: Elapsed time: 881.803s, Critical Path: 37.21s
FAILED: Build did NOT complete successfully
Если я попробую другую команду:
bazel build -c opt tensorflow_serving/model_servers/...
чтобы специально создать подкаталог обслуживания, ошибка происходит следующим образом:
ERROR:
/home/serving/tensorflow_serving/batching/BUILD:122:1: C++ compilation of rule '//tensorflow_serving/batching:batching_util' failed (Exit 4)
tensorflow_serving/batching/batching_util.cc: In function 'std::map<std::basic_string<char>, std::vector<int> > tensorflow::serving::CalculateMaxDimSizes(const std::vector<std::vector<std::pair<std::basic_string<char>, tensorflow::Tensor> > >&)':
tensorflow_serving/batching/batching_util.cc:165:34: warning: comparison between signed and unsigned integer expressions [-Wsign-compare]
for (int i = 0; i < batch.size(); ++i) {
^
gcc: internal compiler error: Killed (program cc1plus)
Please submit a full bug report,
with preprocessed source if appropriate.
See <http://bugzilla.redhat.com/bugzilla> for instructions.
INFO: Elapsed time: 1486.641s, Critical Path: 211.94s
FAILED: Build did NOT complete successfully
Пожалуйста, прости мой плохой английский и помоги мне … Я застрял в этой проблеме в течение достаточно долгого времени.
Нашел похожую проблему (349) на GitHub TensorFlow, и вполне вероятно, что у вас не хватает памяти. Они предлагают добавить аргумент «—jobs 1 —local_resources 2048, .5,1.0», чтобы Bazel порождал не более одного процесса компиляции одновременно и ограничивал использование системных ресурсов.
Других решений пока нет …