Added program argument to lock pretrained embeddings

5b723ac5 · Franck Dary · 032ca410 · 5b723ac5 · 5b723ac5 · 5b723ac5
Commit 5b723ac5 authored 4 years ago by Franck Dary
--- a/torch_modules/include/WordEmbeddings.hpp
+++ b/torch_modules/include/WordEmbeddings.hpp
@@ -8,6 +8,7 @@ class WordEmbeddingsImpl : public torch::nn::Module
  private :

  static bool scaleGradByFreq;
+  static bool canTrainPretrained;
  static float maxNorm;

  private :
@@ -18,6 +19,8 @@ class WordEmbeddingsImpl : public torch::nn::Module

  static void setScaleGradByFreq(bool scaleGradByFreq);
  static void setMaxNorm(float maxNorm);
+  static void setCanTrainPretrained(bool value);
+  static bool getCanTrainPretrained();

  WordEmbeddingsImpl(std::size_t vocab, std::size_t dim);
  torch::nn::Embedding get();

--- a/torch_modules/src/Submodule.cpp
+++ b/torch_modules/src/Submodule.cpp
 #include "Submodule.hpp"
+#include "WordEmbeddings.hpp"

 void Submodule::setFirstInputIndex(std::size_t firstInputIndex)
 {
@@ -74,6 +75,7 @@ void Submodule::loadPretrainedW2vEmbeddings(torch::nn::Embedding embeddings, std
    util::myThrow(fmt::format("file '{}' is empty", path.string()));

  getDict().setState(originalState);
+  embeddings->weight.set_requires_grad(WordEmbeddingsImpl::getCanTrainPretrained());
 }

 std::function<std::string(const std::string &)> Submodule::getFunction(const std::string functionNames)

--- a/torch_modules/src/WordEmbeddings.cpp
+++ b/torch_modules/src/WordEmbeddings.cpp
 #include "WordEmbeddings.hpp"

 bool WordEmbeddingsImpl::scaleGradByFreq = false;
+bool WordEmbeddingsImpl::canTrainPretrained = false;
 float WordEmbeddingsImpl::maxNorm = std::numeric_limits<float>::max();

 WordEmbeddingsImpl::WordEmbeddingsImpl(std::size_t vocab, std::size_t dim)
@@ -23,8 +24,18 @@ void WordEmbeddingsImpl::setMaxNorm(float maxNorm)
  WordEmbeddingsImpl::maxNorm = maxNorm;
 }

+void WordEmbeddingsImpl::setCanTrainPretrained(bool value)
+{
+  WordEmbeddingsImpl::canTrainPretrained = value;
+}
+
 torch::Tensor WordEmbeddingsImpl::forward(torch::Tensor input)
 {
  return embeddings(input);
 }

+bool WordEmbeddingsImpl::getCanTrainPretrained()
+{
+  return canTrainPretrained;
+}
+
--- a/trainer/src/MacaonTrain.cpp
+++ b/trainer/src/MacaonTrain.cpp
@@ -45,6 +45,7 @@ po::options_description MacaonTrain::getOptionsDescription()
    ("scaleGrad", "Scale embedding's gradient with its frequence in the minibatch")
    ("maxNorm", po::value<float>()->default_value(std::numeric_limits<float>::max()),
      "Max norm for the embeddings")
+    ("lockPretrained", "Disable fine tuning of all pretrained word embeddings.")
    ("help,h", "Produce this help message");

  desc.add(req).add(opt);
@@ -137,6 +138,7 @@ int MacaonTrain::main()
  auto seed = variables["seed"].as<int>();
  WordEmbeddingsImpl::setMaxNorm(variables["maxNorm"].as<float>());
  WordEmbeddingsImpl::setScaleGradByFreq(variables.count("scaleGrad") != 0);
+  WordEmbeddingsImpl::setCanTrainPretrained(variables.count("lockPretrained") == 0);

  std::srand(seed);
  torch::manual_seed(seed);