Deploying to gh-pages from @ ssciwr/AMMICO@efe1851fea 🚀

2025-10-29 13:06:04 +02:00 · 2025-04-10 20:23:09 +00:00 · 2025-04-10 20:23:09 +00:00 · 485b14a6f6
--- a/build/doctrees/ammico.doctree
+++ b/build/doctrees/ammico.doctree
--- a/build/doctrees/environment.pickle
+++ b/build/doctrees/environment.pickle
--- a/build/doctrees/notebooks/DemoNotebook_ammico.doctree
+++ b/build/doctrees/notebooks/DemoNotebook_ammico.doctree
--- a/build/html/ammico.html
+++ b/build/html/ammico.html
@ -54,32 +54,7 @@
 <li class="toctree-l1"><a class="reference internal" href="notebooks/DemoNotebook_ammico.html#The-detector-modules">The detector modules</a></li>
 <li class="toctree-l1"><a class="reference internal" href="notebooks/Example%20cropposts.html">Crop posts module</a></li>
 <li class="toctree-l1 current"><a class="reference internal" href="modules.html">AMMICO package modules</a><ul class="current">
-<li class="toctree-l2 current"><a class="current reference internal" href="#">text module</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="#text.PostprocessText"><code class="docutils literal notranslate"><span class="pre">PostprocessText</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#text.PostprocessText.analyse_topic"><code class="docutils literal notranslate"><span class="pre">PostprocessText.analyse_topic()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.PostprocessText.get_text_df"><code class="docutils literal notranslate"><span class="pre">PostprocessText.get_text_df()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.PostprocessText.get_text_dict"><code class="docutils literal notranslate"><span class="pre">PostprocessText.get_text_dict()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l3"><a class="reference internal" href="#text.TextAnalyzer"><code class="docutils literal notranslate"><span class="pre">TextAnalyzer</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextAnalyzer.read_csv"><code class="docutils literal notranslate"><span class="pre">TextAnalyzer.read_csv()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l3"><a class="reference internal" href="#text.TextDetector"><code class="docutils literal notranslate"><span class="pre">TextDetector</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.analyse_image"><code class="docutils literal notranslate"><span class="pre">TextDetector.analyse_image()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.clean_text"><code class="docutils literal notranslate"><span class="pre">TextDetector.clean_text()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.get_text_from_image"><code class="docutils literal notranslate"><span class="pre">TextDetector.get_text_from_image()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.remove_linebreaks"><code class="docutils literal notranslate"><span class="pre">TextDetector.remove_linebreaks()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.set_keys"><code class="docutils literal notranslate"><span class="pre">TextDetector.set_keys()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.text_ner"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_ner()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.text_sentiment_transformers"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_sentiment_transformers()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.text_summary"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_summary()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#text.TextDetector.translate_text"><code class="docutils literal notranslate"><span class="pre">TextDetector.translate_text()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l3"><a class="reference internal" href="#text.privacy_disclosure"><code class="docutils literal notranslate"><span class="pre">privacy_disclosure()</span></code></a></li>
-</ul>
-</li>
+<li class="toctree-l2 current"><a class="current reference internal" href="#">text module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="#module-summary">summary module</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="#summary.SummaryDetector"><code class="docutils literal notranslate"><span class="pre">SummaryDetector</span></code></a><ul>
 <li class="toctree-l4"><a class="reference internal" href="#summary.SummaryDetector.all_allowed_model_types"><code class="docutils literal notranslate"><span class="pre">SummaryDetector.all_allowed_model_types</span></code></a></li>
@ -106,41 +81,7 @@
 </li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="#module-multimodal_search">multimodal search module</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="#multimodal_search.MultimodalSearch"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.compute_gradcam_batch"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.compute_gradcam_batch()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.extract_image_features_basic"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_basic()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.extract_image_features_blip2"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_blip2()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.extract_image_features_clip"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_clip()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.extract_text_features"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_text_features()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.get_att_map"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.get_att_map()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.get_pathes_from_query"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.get_pathes_from_query()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.image_text_match_reordering"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.image_text_match_reordering()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.itm_text_precessing"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.itm_text_precessing()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_albef"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_albef()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_blip()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip2"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_blip2()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_base"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_base()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_vitl14()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14_336"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_vitl14_336()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.load_tensors"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_tensors()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.multimodal_device"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.multimodal_device</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.multimodal_search"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.multimodal_search()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.parsing_images"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.parsing_images()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.querys_processing"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.querys_processing()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.read_and_process_images"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_and_process_images()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.read_and_process_images_itm"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_and_process_images_itm()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.read_img"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_img()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.resize_img"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.resize_img()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.save_tensors"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.save_tensors()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.show_results"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.show_results()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.upload_model_blip2_coco"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip2_coco()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.upload_model_blip_base"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip_base()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#multimodal_search.MultimodalSearch.upload_model_blip_large"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip_large()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
+<li class="toctree-l2"><a class="reference internal" href="#multimodal-search-module">multimodal search module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="#module-faces">faces module</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="#faces.EmotionDetector"><code class="docutils literal notranslate"><span class="pre">EmotionDetector</span></code></a><ul>
 <li class="toctree-l4"><a class="reference internal" href="#faces.EmotionDetector.analyse_image"><code class="docutils literal notranslate"><span class="pre">EmotionDetector.analyse_image()</span></code></a></li>
@ -176,36 +117,8 @@
 <li class="toctree-l3"><a class="reference internal" href="#cropposts.paste_image_and_comment"><code class="docutils literal notranslate"><span class="pre">paste_image_and_comment()</span></code></a></li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="#module-utils">utils module</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="#utils.AnalysisMethod"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#utils.AnalysisMethod.analyse_image"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod.analyse_image()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#utils.AnalysisMethod.set_keys"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod.set_keys()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.DownloadResource"><code class="docutils literal notranslate"><span class="pre">DownloadResource</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#utils.DownloadResource.get"><code class="docutils literal notranslate"><span class="pre">DownloadResource.get()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#utils.DownloadResource.resources"><code class="docutils literal notranslate"><span class="pre">DownloadResource.resources</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.ammico_prefetch_models"><code class="docutils literal notranslate"><span class="pre">ammico_prefetch_models()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.append_data_to_dict"><code class="docutils literal notranslate"><span class="pre">append_data_to_dict()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.dump_df"><code class="docutils literal notranslate"><span class="pre">dump_df()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.find_files"><code class="docutils literal notranslate"><span class="pre">find_files()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.get_color_table"><code class="docutils literal notranslate"><span class="pre">get_color_table()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.get_dataframe"><code class="docutils literal notranslate"><span class="pre">get_dataframe()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.initialize_dict"><code class="docutils literal notranslate"><span class="pre">initialize_dict()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.is_interactive"><code class="docutils literal notranslate"><span class="pre">is_interactive()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="#utils.iterable"><code class="docutils literal notranslate"><span class="pre">iterable()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="#module-display">display module</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="#display.AnalysisExplorer"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="#display.AnalysisExplorer.run_server"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer.run_server()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="#display.AnalysisExplorer.update_picture"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer.update_picture()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
+<li class="toctree-l2"><a class="reference internal" href="#utils-module">utils module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="#display-module">display module</a></li>
 </ul>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="license_link.html">License</a></li>
@ -236,155 +149,8 @@
          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
           <div itemprop="articleBody">
             
-  <section id="module-text">
-<span id="text-module"></span><h1>text module<a class="headerlink" href="#module-text" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="text.PostprocessText">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">text.</span></span><span class="sig-name descname"><span class="pre">PostprocessText</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">mydict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">use_csv</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">csv_path</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">analyze_text</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'text_english'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#text.PostprocessText" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
-<dl class="py method">
-<dt class="sig sig-object py" id="text.PostprocessText.analyse_topic">
-<span class="sig-name descname"><span class="pre">analyse_topic</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">return_topics</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">3</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#text.PostprocessText.analyse_topic" title="Link to this definition"></a></dt>
-<dd><p>Performs topic analysis using BERTopic.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>return_topics</strong> (<em>int</em><em>, </em><em>optional</em>) – Number of topics to return. Defaults to 3.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>tuple</strong> – A tuple containing the topic model, topic dataframe, and most frequent topics.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.PostprocessText.get_text_df">
-<span class="sig-name descname"><span class="pre">get_text_df</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">analyze_text</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">list</span></span></span><a class="headerlink" href="#text.PostprocessText.get_text_df" title="Link to this definition"></a></dt>
-<dd><p>Extracts text from the provided dataframe.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>analyze_text</strong> (<em>str</em>) – Column name for the text field to analyze.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>list</strong> – A list of text extracted from the dataframe.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.PostprocessText.get_text_dict">
-<span class="sig-name descname"><span class="pre">get_text_dict</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">analyze_text</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">list</span></span></span><a class="headerlink" href="#text.PostprocessText.get_text_dict" title="Link to this definition"></a></dt>
-<dd><p>Extracts text from the provided dictionary.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>analyze_text</strong> (<em>str</em>) – Key for the text field to analyze.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>list</strong> – A list of text extracted from the dictionary.</p>
-</dd>
-</dl>
-</dd></dl>
-
-</dd></dl>
-
-<dl class="py class">
-<dt class="sig sig-object py" id="text.TextAnalyzer">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">text.</span></span><span class="sig-name descname"><span class="pre">TextAnalyzer</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">csv_path</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">column_key</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">csv_encoding</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'utf-8'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#text.TextAnalyzer" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
-<p>Used to get text from a csv and then run the TextDetector on it.</p>
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextAnalyzer.read_csv">
-<span class="sig-name descname"><span class="pre">read_csv</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#text.TextAnalyzer.read_csv" title="Link to this definition"></a></dt>
-<dd><p>Read the CSV file and return the dictionary with the text entries.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>dict</strong> – The dictionary with the text entries.</p>
-</dd>
-</dl>
-</dd></dl>
-
-</dd></dl>
-
-<dl class="py class">
-<dt class="sig sig-object py" id="text.TextDetector">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">text.</span></span><span class="sig-name descname"><span class="pre">TextDetector</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">subdict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">analyse_text</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">skip_extraction</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_names</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">revision_numbers</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_privacy</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'PRIVACY_AMMICO'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">AnalysisMethod</span></code></p>
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.analyse_image">
-<span class="sig-name descname"><span class="pre">analyse_image</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#text.TextDetector.analyse_image" title="Link to this definition"></a></dt>
-<dd><p>Perform text extraction and analysis of the text.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>dict</strong> – The updated dictionary with text analysis results.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.clean_text">
-<span class="sig-name descname"><span class="pre">clean_text</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.clean_text" title="Link to this definition"></a></dt>
-<dd><p>Clean the text from unrecognized words and any numbers.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.get_text_from_image">
-<span class="sig-name descname"><span class="pre">get_text_from_image</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.get_text_from_image" title="Link to this definition"></a></dt>
-<dd><p>Detect text on the image using Google Cloud Vision API.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.remove_linebreaks">
-<span class="sig-name descname"><span class="pre">remove_linebreaks</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.remove_linebreaks" title="Link to this definition"></a></dt>
-<dd><p>Remove linebreaks from original and translated text.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.set_keys">
-<span class="sig-name descname"><span class="pre">set_keys</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#text.TextDetector.set_keys" title="Link to this definition"></a></dt>
-<dd><p>Set the default keys for text analysis.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>dict</strong> – The dictionary with default text keys.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.text_ner">
-<span class="sig-name descname"><span class="pre">text_ner</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.text_ner" title="Link to this definition"></a></dt>
-<dd><p>Perform named entity recognition on the text using the Transformers pipeline.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.text_sentiment_transformers">
-<span class="sig-name descname"><span class="pre">text_sentiment_transformers</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.text_sentiment_transformers" title="Link to this definition"></a></dt>
-<dd><p>Perform text classification for sentiment using the Transformers pipeline.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.text_summary">
-<span class="sig-name descname"><span class="pre">text_summary</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.text_summary" title="Link to this definition"></a></dt>
-<dd><p>Generate a summary of the text using the Transformers pipeline.</p>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="text.TextDetector.translate_text">
-<span class="sig-name descname"><span class="pre">translate_text</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#text.TextDetector.translate_text" title="Link to this definition"></a></dt>
-<dd><p>Translate the detected text to English using the Translator object.</p>
-</dd></dl>
-
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="text.privacy_disclosure">
-<span class="sig-prename descclassname"><span class="pre">text.</span></span><span class="sig-name descname"><span class="pre">privacy_disclosure</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">accept_privacy</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'PRIVACY_AMMICO'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#text.privacy_disclosure" title="Link to this definition"></a></dt>
-<dd><p>Asks the user to accept the privacy statement.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>accept_privacy</strong> (<em>str</em>) – The name of the disclosure variable (default: “PRIVACY_AMMICO”).</p>
-</dd>
-</dl>
-</dd></dl>
-
+  <section id="text-module">
+<h1>text module<a class="headerlink" href="#text-module" title="Link to this heading"></a></h1>
 </section>
 <section id="module-summary">
 <span id="summary-module"></span><h1>summary module<a class="headerlink" href="#module-summary" title="Link to this heading"></a></h1>
@ -675,523 +441,8 @@
 </dd></dl>

 </section>
-<section id="module-multimodal_search">
-<span id="multimodal-search-module"></span><h1>multimodal search module<a class="headerlink" href="#module-multimodal_search" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">multimodal_search.</span></span><span class="sig-name descname"><span class="pre">MultimodalSearch</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">subdict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">AnalysisMethod</span></code></p>
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.compute_gradcam_batch">
-<span class="sig-name descname"><span class="pre">compute_gradcam_batch</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Module</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">visual_input</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">text_input</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tokenized_text</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">block_num</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">6</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.compute_gradcam_batch" title="Link to this definition"></a></dt>
-<dd><p>Compute gradcam for itm model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>visual_input</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p></li>
-<li><p><strong>text_input</strong> (<em>str</em>) – text.</p></li>
-<li><p><strong>tokenized_text</strong> (<em>torch.Tensor</em>) – tokenized text.</p></li>
-<li><p><strong>block_num</strong> (<em>int</em>) – number of block. Default: 6.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>gradcam</strong> (<em>torch.Tensor</em>) – gradcam.</p></li>
-<li><p><strong>output</strong> (<em>torch.Tensor</em>) – output of model.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.extract_image_features_basic">
-<span class="sig-name descname"><span class="pre">extract_image_features_basic</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">images_tensors</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.extract_image_features_basic" title="Link to this definition"></a></dt>
-<dd><p>Extract image features from images_tensors with blip_feature_extractor or albef_feature_extractor model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>images_tensors</strong> (<em>torch.Tensor</em>) – tensors of images stacked in device.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.extract_image_features_blip2">
-<span class="sig-name descname"><span class="pre">extract_image_features_blip2</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">images_tensors</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.extract_image_features_blip2" title="Link to this definition"></a></dt>
-<dd><p>Extract image features from images_tensors with blip2_feature_extractor model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>images_tensors</strong> (<em>torch.Tensor</em>) – tensors of images stacked in device.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.extract_image_features_clip">
-<span class="sig-name descname"><span class="pre">extract_image_features_clip</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">images_tensors</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.extract_image_features_clip" title="Link to this definition"></a></dt>
-<dd><p>Extract image features from images_tensors with clip_feature_extractor model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>images_tensors</strong> (<em>torch.Tensor</em>) – tensors of images stacked in device.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.extract_text_features">
-<span class="sig-name descname"><span class="pre">extract_text_features</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">text_input</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.extract_text_features" title="Link to this definition"></a></dt>
-<dd><p>Extract text features from text_input with feature_extractor model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>text_input</strong> (<em>str</em>) – text.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>features_text</strong> (<em>torch.Tensor</em>) – tensors of text features.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.get_att_map">
-<span class="sig-name descname"><span class="pre">get_att_map</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">ndarray</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">att_map</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">ndarray</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">blur</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">overlap</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">ndarray</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.get_att_map" title="Link to this definition"></a></dt>
-<dd><p>Get attention map.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>img</strong> (<em>np.ndarray</em>) – image.</p></li>
-<li><p><strong>att_map</strong> (<em>np.ndarray</em>) – attention map.</p></li>
-<li><p><strong>blur</strong> (<em>bool</em>) – blur attention map. Default: True.</p></li>
-<li><p><strong>overlap</strong> (<em>bool</em>) – overlap attention map with image. Default: True.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>att_map</strong> (<em>np.ndarray</em>) – attention map.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.get_pathes_from_query">
-<span class="sig-name descname"><span class="pre">get_pathes_from_query</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="p"><span class="pre">[</span></span><span class="pre">str</span><span class="p"><span class="pre">,</span></span><span class="w"> </span><span class="pre">str</span><span class="p"><span class="pre">]</span></span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.get_pathes_from_query" title="Link to this definition"></a></dt>
-<dd><p>Get pathes and image names from query.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>query</strong> (<em>dict</em>) – query.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>paths</strong> (<em>list</em>) – list of pathes.</p></li>
-<li><p><strong>image_names</strong> (<em>list</em>) – list of image names.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.image_text_match_reordering">
-<span class="sig-name descname"><span class="pre">image_text_match_reordering</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">search_query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span><span class="p"><span class="pre">[</span></span><span class="pre">dict</span><span class="p"><span class="pre">[</span></span><span class="pre">str</span><span class="p"><span class="pre">,</span></span><span class="w"> </span><span class="pre">str</span><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span></em>, <em class="sig-param"><span class="n"><span class="pre">itm_model_type</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">image_keys</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sorted_lists</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span><span class="p"><span class="pre">[</span></span><span class="pre">list</span><span class="p"><span class="pre">]</span></span></span></em>, <em class="sig-param"><span class="n"><span class="pre">batch_size</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">need_grad_cam</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.image_text_match_reordering" title="Link to this definition"></a></dt>
-<dd><p>Reorder images with itm model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>search_query</strong> (<em>list</em>) – list of querys.</p></li>
-<li><p><strong>itm_model_type</strong> (<em>str</em>) – type of the model.</p></li>
-<li><p><strong>image_keys</strong> (<em>list</em>) – sorted list of image keys.</p></li>
-<li><p><strong>sorted_lists</strong> (<em>list</em>) – sorted list of similarity.</p></li>
-<li><p><strong>batch_size</strong> (<em>int</em>) – batch size. Default: 1.</p></li>
-<li><p><strong>need_grad_cam</strong> (<em>bool</em>) – need gradcam. Default: False. blip2_coco model does not yet work with gradcam.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>itm_scores2</strong> – list of itm scores.</p></li>
-<li><p><strong>image_gradcam_with_itm</strong> – dict of image names and gradcam.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.itm_text_precessing">
-<span class="sig-name descname"><span class="pre">itm_text_precessing</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">search_query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span><span class="p"><span class="pre">[</span></span><span class="pre">dict</span><span class="p"><span class="pre">[</span></span><span class="pre">str</span><span class="p"><span class="pre">,</span></span><span class="w"> </span><span class="pre">str</span><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">list</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.itm_text_precessing" title="Link to this definition"></a></dt>
-<dd><p>Process text querys for itm model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>search_query</strong> (<em>list</em>) – list of querys.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>text_query_index</strong> (<em>list</em>) – list of indexes of text querys.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_albef">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_albef</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_albef" title="Link to this definition"></a></dt>
-<dd><p>Load base albef_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_blip">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_blip</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip" title="Link to this definition"></a></dt>
-<dd><p>Load base blip_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_blip2">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_blip2</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip2" title="Link to this definition"></a></dt>
-<dd><p>Load pretrain blip2_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_base">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_clip_base</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_base" title="Link to this definition"></a></dt>
-<dd><p>Load base clip_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_clip_vitl14</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14" title="Link to this definition"></a></dt>
-<dd><p>Load ViT-L-14 clip_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14_336">
-<span class="sig-name descname"><span class="pre">load_feature_extractor_model_clip_vitl14_336</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'cpu'</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14_336" title="Link to this definition"></a></dt>
-<dd><p>Load ViT-L-14-336 clip_feature_extractor model and preprocessors for visual and text inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>device</strong> (<em>str</em>) – device to use. Can be “cpu” or “cuda”. Default: “cpu”.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.load_tensors">
-<span class="sig-name descname"><span class="pre">load_tensors</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.load_tensors" title="Link to this definition"></a></dt>
-<dd><p>Load tensors from given path.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>name</strong> (<em>str</em>) – name of the file.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py attribute">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.multimodal_device">
-<span class="sig-name descname"><span class="pre">multimodal_device</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">device(type='cpu')</span></em><a class="headerlink" href="#multimodal_search.MultimodalSearch.multimodal_device" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.multimodal_search">
-<span class="sig-name descname"><span class="pre">multimodal_search</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vis_processors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">txt_processors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_type</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">image_keys</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features_image_stacked</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">search_query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">filter_number_of_images</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">filter_val_limit</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">filter_rel_error</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.multimodal_search" title="Link to this definition"></a></dt>
-<dd><p>Search for images with given querys.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-<li><p><strong>model_type</strong> (<em>str</em>) – type of the model.</p></li>
-<li><p><strong>image_keys</strong> (<em>list</em>) – sorted list of image keys.</p></li>
-<li><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p></li>
-<li><p><strong>search_query</strong> (<em>list</em>) – list of querys.</p></li>
-<li><p><strong>filter_number_of_images</strong> (<em>str</em>) – number of images to show. Default: None.</p></li>
-<li><p><strong>filter_val_limit</strong> (<em>str</em>) – limit of similarity value. Default: None.</p></li>
-<li><p><strong>filter_rel_error</strong> (<em>str</em>) – limit of relative error. Default: None.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>similarity</strong> (<em>torch.Tensor</em>) – similarity between images and querys.</p></li>
-<li><p><strong>sorted_lists</strong> (<em>list</em>) – sorted list of similarity.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.parsing_images">
-<span class="sig-name descname"><span class="pre">parsing_images</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model_type</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">path_to_save_tensors</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'./saved_tensors/'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">path_to_load_tensors</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.parsing_images" title="Link to this definition"></a></dt>
-<dd><p>Parsing images with feature_extractor model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model_type</strong> (<em>str</em>) – type of the model.</p></li>
-<li><p><strong>path_to_save_tensors</strong> (<em>str</em>) – path to save the tensors. Default: “./saved_tensors/”.</p></li>
-<li><p><strong>path_to_load_tensors</strong> (<em>str</em>) – path to load the tesors. Default: None.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-<li><p><strong>image_keys</strong> (<em>list</em>) – sorted list of image keys.</p></li>
-<li><p><strong>image_names</strong> (<em>list</em>) – sorted list of image names.</p></li>
-<li><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.querys_processing">
-<span class="sig-name descname"><span class="pre">querys_processing</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">search_query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">txt_processors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vis_processors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_type</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">Tensor</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.querys_processing" title="Link to this definition"></a></dt>
-<dd><p>Process querys.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>search_query</strong> (<em>list</em>) – list of querys.</p></li>
-<li><p><strong>model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>txt_processors</strong> (<em>dict</em>) – preprocessors for text inputs.</p></li>
-<li><p><strong>vis_processors</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-<li><p><strong>model_type</strong> (<em>str</em>) – type of the model.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>multi_features_stacked</strong> (<em>torch.Tensor</em>) – tensors of querys features.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.read_and_process_images">
-<span class="sig-name descname"><span class="pre">read_and_process_images</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">image_paths</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vis_processor</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.read_and_process_images" title="Link to this definition"></a></dt>
-<dd><p>Read and process images with vis_processor.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>image_paths</strong> (<em>str</em>) – paths to images.</p></li>
-<li><p><strong>vis_processor</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>raw_images</strong> (<em>list</em>) – list of images.</p></li>
-<li><p><strong>images_tensors</strong> (<em>torch.Tensor</em>) – tensors of images stacked in device.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.read_and_process_images_itm">
-<span class="sig-name descname"><span class="pre">read_and_process_images_itm</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">image_paths</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vis_processor</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.read_and_process_images_itm" title="Link to this definition"></a></dt>
-<dd><p>Read and process images with vis_processor for itm model.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>image_paths</strong> (<em>list</em>) – paths to images.</p></li>
-<li><p><strong>vis_processor</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><ul class="simple">
-<li><p><strong>raw_images</strong> (<em>list</em>) – list of images.</p></li>
-<li><p><strong>images_tensors</strong> (<em>torch.Tensor</em>) – tensors of images stacked in device.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.read_img">
-<span class="sig-name descname"><span class="pre">read_img</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">filepath</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">&lt;module</span> <span class="pre">'PIL.Image'</span> <span class="pre">from</span> <span class="pre">'/opt/hostedtoolcache/Python/3.9.21/x64/lib/python3.9/site-packages/PIL/Image.py'&gt;</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.read_img" title="Link to this definition"></a></dt>
-<dd><p>Load Image from filepath.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>filepath</strong> (<em>str</em>) – path to image.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>raw_image</strong> (<em>PIL.Image</em>) – image.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.resize_img">
-<span class="sig-name descname"><span class="pre">resize_img</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">raw_img:</span> <span class="pre">&lt;module</span> <span class="pre">'PIL.Image'</span> <span class="pre">from</span> <span class="pre">'/opt/hostedtoolcache/Python/3.9.21/x64/lib/python3.9/site-packages/PIL/Image.py'&gt;</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#multimodal_search.MultimodalSearch.resize_img" title="Link to this definition"></a></dt>
-<dd><p>Proportional resize image to 240 p width.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>raw_img</strong> (<em>PIL.Image</em>) – image.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>resized_image</strong> (<em>PIL.Image</em>) – proportional resized image to 240p.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.save_tensors">
-<span class="sig-name descname"><span class="pre">save_tensors</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model_type</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features_image_stacked</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'saved_features_image.pt'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">path</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'./saved_tensors/'</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">str</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.save_tensors" title="Link to this definition"></a></dt>
-<dd><p>Save tensors as binary to given path.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>model_type</strong> (<em>str</em>) – type of the model.</p></li>
-<li><p><strong>features_image_stacked</strong> (<em>torch.Tensor</em>) – tensors of images features stacked in device.</p></li>
-<li><p><strong>name</strong> (<em>str</em>) – name of the file. Default: “saved_features_image.pt”.</p></li>
-<li><p><strong>path</strong> (<em>str</em>) – path to save the file. Default: “./saved_tensors/”.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>name</strong> (<em>str</em>) – name of the file.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.show_results">
-<span class="sig-name descname"><span class="pre">show_results</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">query</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">itm</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">image_gradcam_with_itm</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">{}</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">None</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.show_results" title="Link to this definition"></a></dt>
-<dd><p>Show results of search.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>query</strong> (<em>dict</em>) – query.</p></li>
-<li><p><strong>itm</strong> (<em>bool</em>) – use itm model. Default: False.</p></li>
-<li><p><strong>image_gradcam_with_itm</strong> (<em>dict</em>) – use gradcam. Default: empty.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.upload_model_blip2_coco">
-<span class="sig-name descname"><span class="pre">upload_model_blip2_coco</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.upload_model_blip2_coco" title="Link to this definition"></a></dt>
-<dd><p>Load coco blip2_image_text_matching model and preprocessors for visual inputs from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>itm_model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processor</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.upload_model_blip_base">
-<span class="sig-name descname"><span class="pre">upload_model_blip_base</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.upload_model_blip_base" title="Link to this definition"></a></dt>
-<dd><p>Load base blip_image_text_matching model and preprocessors for visual input from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>itm_model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processor</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="multimodal_search.MultimodalSearch.upload_model_blip_large">
-<span class="sig-name descname"><span class="pre">upload_model_blip_large</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">tuple</span></span></span><a class="headerlink" href="#multimodal_search.MultimodalSearch.upload_model_blip_large" title="Link to this definition"></a></dt>
-<dd><p>Load large blip_image_text_matching model and preprocessors for visual input from lavis.models.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Returns<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>itm_model</strong> (<em>torch.nn.Module</em>) – model.</p></li>
-<li><p><strong>vis_processor</strong> (<em>dict</em>) – preprocessors for visual inputs.</p></li>
-</ul>
-</dd>
-</dl>
-</dd></dl>
-
-</dd></dl>
-
+<section id="multimodal-search-module">
+<h1>multimodal search module<a class="headerlink" href="#multimodal-search-module" title="Link to this heading"></a></h1>
 </section>
 <section id="module-faces">
 <span id="faces-module"></span><h1>faces module<a class="headerlink" href="#module-faces" title="Link to this heading"></a></h1>
@ -1521,161 +772,11 @@ below which regions should be cropped.</p></li>
 </dd></dl>

 </section>
-<section id="module-utils">
-<span id="utils-module"></span><h1>utils module<a class="headerlink" href="#module-utils" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="utils.AnalysisMethod">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">AnalysisMethod</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">subdict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#utils.AnalysisMethod" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
-<p>Base class to be inherited by all analysis methods.</p>
-<dl class="py method">
-<dt class="sig sig-object py" id="utils.AnalysisMethod.analyse_image">
-<span class="sig-name descname"><span class="pre">analyse_image</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.AnalysisMethod.analyse_image" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="utils.AnalysisMethod.set_keys">
-<span class="sig-name descname"><span class="pre">set_keys</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.AnalysisMethod.set_keys" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-</dd></dl>
-
-<dl class="py class">
-<dt class="sig sig-object py" id="utils.DownloadResource">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">DownloadResource</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#utils.DownloadResource" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
-<p>A remote resource that needs on demand downloading.</p>
-<p>We use this as a wrapper to the pooch library. The wrapper registers
-each data file and allows prefetching through the CLI entry point
-ammico_prefetch_models.</p>
-<dl class="py method">
-<dt class="sig sig-object py" id="utils.DownloadResource.get">
-<span class="sig-name descname"><span class="pre">get</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.DownloadResource.get" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<dl class="py attribute">
-<dt class="sig sig-object py" id="utils.DownloadResource.resources">
-<span class="sig-name descname"><span class="pre">resources</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[]</span></em><a class="headerlink" href="#utils.DownloadResource.resources" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.ammico_prefetch_models">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">ammico_prefetch_models</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.ammico_prefetch_models" title="Link to this definition"></a></dt>
-<dd><p>Prefetch all the download resources</p>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.append_data_to_dict">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">append_data_to_dict</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">mydict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#utils.append_data_to_dict" title="Link to this definition"></a></dt>
-<dd><p>Append entries from nested dictionaries to keys in a global dict.</p>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.dump_df">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">dump_df</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">mydict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">DataFrame</span></span></span><a class="headerlink" href="#utils.dump_df" title="Link to this definition"></a></dt>
-<dd><p>Utility to dump the dictionary into a dataframe.</p>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.find_files">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">find_files</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">path</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pattern</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">['png',</span> <span class="pre">'jpg',</span> <span class="pre">'jpeg',</span> <span class="pre">'gif',</span> <span class="pre">'webp',</span> <span class="pre">'avif',</span> <span class="pre">'tiff']</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">recursive</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">limit</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">random_seed</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#utils.find_files" title="Link to this definition"></a></dt>
-<dd><p>Find image files on the file system.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><ul class="simple">
-<li><p><strong>path</strong> (<em>str</em><em>, </em><em>optional</em>) – The base directory where we are looking for the images. Defaults
-to None, which uses the ammico data directory if set or the current
-working directory otherwise.</p></li>
-<li><p><strong>pattern</strong> (<em>str</em><em>|</em><em>list</em><em>, </em><em>optional</em>) – The naming pattern that the filename should match.
-Use either ‘.ext’ or just ‘ext’
-Defaults to [“png”, “jpg”, “jpeg”, “gif”, “webp”, “avif”,”tiff”]. Can be used to allow other patterns or to only include
-specific prefixes or suffixes.</p></li>
-<li><p><strong>recursive</strong> (<em>bool</em><em>, </em><em>optional</em>) – Whether to recurse into subdirectories. Default is set to True.</p></li>
-<li><p><strong>limit</strong> (<em>int/list</em><em>, </em><em>optional</em>) – The maximum number of images to be found.
-Provide a list or tuple of length 2 to batch the images.
-Defaults to 20. To return all images, set to None or -1.</p></li>
-<li><p><strong>random_seed</strong> (<em>int</em><em>, </em><em>optional</em>) – The random seed to use for shuffling the images.
-If None is provided the data will not be shuffeled. Defaults to None.</p></li>
-</ul>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>dict</strong> – A nested dictionary with file ids and all filenames including the path.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.get_color_table">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">get_color_table</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.get_color_table" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.get_dataframe">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">get_dataframe</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">mydict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">DataFrame</span></span></span><a class="headerlink" href="#utils.get_dataframe" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.initialize_dict">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">initialize_dict</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">filelist</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">list</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">dict</span></span></span><a class="headerlink" href="#utils.initialize_dict" title="Link to this definition"></a></dt>
-<dd><p>Initialize the nested dictionary for all the found images.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>filelist</strong> (<em>list</em>) – The list of files to be analyzed, including their paths.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>dict</strong> – The nested dictionary with all image ids and their paths.</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.is_interactive">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">is_interactive</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#utils.is_interactive" title="Link to this definition"></a></dt>
-<dd><p>Check if we are running in an interactive environment.</p>
-</dd></dl>
-
-<dl class="py function">
-<dt class="sig sig-object py" id="utils.iterable">
-<span class="sig-prename descclassname"><span class="pre">utils.</span></span><span class="sig-name descname"><span class="pre">iterable</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">arg</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#utils.iterable" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
+<section id="utils-module">
+<h1>utils module<a class="headerlink" href="#utils-module" title="Link to this heading"></a></h1>
 </section>
-<section id="module-display">
-<span id="display-module"></span><h1>display module<a class="headerlink" href="#module-display" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="display.AnalysisExplorer">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">display.</span></span><span class="sig-name descname"><span class="pre">AnalysisExplorer</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">mydict</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#display.AnalysisExplorer" title="Link to this definition"></a></dt>
-<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
-<dl class="py method">
-<dt class="sig sig-object py" id="display.AnalysisExplorer.run_server">
-<span class="sig-name descname"><span class="pre">run_server</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">port</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">8050</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><span class="pre">None</span></span></span><a class="headerlink" href="#display.AnalysisExplorer.run_server" title="Link to this definition"></a></dt>
-<dd><p>Run the Dash server to start the analysis explorer.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>port</strong> (<em>int</em><em>, </em><em>optional</em>) – The port number to run the server on (default: 8050).</p>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="display.AnalysisExplorer.update_picture">
-<span class="sig-name descname"><span class="pre">update_picture</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img_path</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#display.AnalysisExplorer.update_picture" title="Link to this definition"></a></dt>
-<dd><p>Callback function to update the displayed image.</p>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p><strong>img_path</strong> (<em>str</em>) – The path of the selected image.</p>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p><strong>Union[PIL.PngImagePlugin, None]</strong> – The image object to be displayed
-or None if the image path is</p>
-</dd>
-</dl>
-</dd></dl>
-
-</dd></dl>
-
+<section id="display-module">
+<h1>display module<a class="headerlink" href="#display-module" title="Link to this heading"></a></h1>
 </section>


--- a/build/html/genindex.html
+++ b/build/html/genindex.html
@ -87,17 +87,12 @@
 | <a href="#D"><strong>D</strong></a>
 | <a href="#E"><strong>E</strong></a>
 | <a href="#F"><strong>F</strong></a>
- | <a href="#G"><strong>G</strong></a>
- | <a href="#I"><strong>I</strong></a>
 | <a href="#K"><strong>K</strong></a>
 | <a href="#L"><strong>L</strong></a>
 | <a href="#M"><strong>M</strong></a>
 | <a href="#P"><strong>P</strong></a>
- | <a href="#Q"><strong>Q</strong></a>
 | <a href="#R"><strong>R</strong></a>
 | <a href="#S"><strong>S</strong></a>
- | <a href="#T"><strong>T</strong></a>
- | <a href="#U"><strong>U</strong></a>
 | <a href="#W"><strong>W</strong></a>
 
 </div>
@ -111,8 +106,6 @@
      <li><a href="ammico.html#summary.SummaryDetector.allowed_model_types">allowed_model_types (summary.SummaryDetector attribute)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.allowed_new_model_types">allowed_new_model_types (summary.SummaryDetector attribute)</a>
-</li>
-      <li><a href="ammico.html#utils.ammico_prefetch_models">ammico_prefetch_models() (in module utils)</a>
 </li>
      <li><a href="ammico.html#colors.ColorDetector.analyse_image">analyse_image() (colors.ColorDetector method)</a>

@ -120,10 +113,6 @@
        <li><a href="ammico.html#faces.EmotionDetector.analyse_image">(faces.EmotionDetector method)</a>
 </li>
        <li><a href="ammico.html#summary.SummaryDetector.analyse_image">(summary.SummaryDetector method)</a>
-</li>
-        <li><a href="ammico.html#text.TextDetector.analyse_image">(text.TextDetector method)</a>
-</li>
-        <li><a href="ammico.html#utils.AnalysisMethod.analyse_image">(utils.AnalysisMethod method)</a>
 </li>
      </ul></li>
  </ul></td>
@ -131,16 +120,8 @@
      <li><a href="ammico.html#summary.SummaryDetector.analyse_questions">analyse_questions() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.analyse_summary">analyse_summary() (summary.SummaryDetector method)</a>
-</li>
-      <li><a href="ammico.html#text.PostprocessText.analyse_topic">analyse_topic() (text.PostprocessText method)</a>
-</li>
-      <li><a href="ammico.html#display.AnalysisExplorer">AnalysisExplorer (class in display)</a>
-</li>
-      <li><a href="ammico.html#utils.AnalysisMethod">AnalysisMethod (class in utils)</a>
 </li>
      <li><a href="ammico.html#faces.EmotionDetector.analyze_single_face">analyze_single_face() (faces.EmotionDetector method)</a>
-</li>
-      <li><a href="ammico.html#utils.append_data_to_dict">append_data_to_dict() (in module utils)</a>
 </li>
  </ul></td>
 </tr></table>
@ -151,8 +132,6 @@
      <li><a href="ammico.html#summary.SummaryDetector.check_model">check_model() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#faces.EmotionDetector.clean_subdict">clean_subdict() (faces.EmotionDetector method)</a>
-</li>
-      <li><a href="ammico.html#text.TextDetector.clean_text">clean_text() (text.TextDetector method)</a>
 </li>
      <li><a href="ammico.html#colors.ColorDetector">ColorDetector (class in colors)</a>
 </li>
@ -167,8 +146,6 @@
 </li>
  </ul></td>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.compute_gradcam_batch">compute_gradcam_batch() (multimodal_search.MultimodalSearch method)</a>
-</li>
      <li><a href="ammico.html#cropposts.crop_image_from_post">crop_image_from_post() (in module cropposts)</a>
 </li>
      <li><a href="ammico.html#cropposts.crop_media_posts">crop_media_posts() (in module cropposts)</a>
@ -192,20 +169,9 @@
  <td style="width: 33%; vertical-align: top;"><ul>
      <li><a href="ammico.html#faces.deepface_symlink_processor">deepface_symlink_processor() (in module faces)</a>
 </li>
-      <li>
-    display
-
-      <ul>
-        <li><a href="ammico.html#module-display">module</a>
-</li>
-      </ul></li>
  </ul></td>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#utils.DownloadResource">DownloadResource (class in utils)</a>
-</li>
      <li><a href="ammico.html#cropposts.draw_matches">draw_matches() (in module cropposts)</a>
-</li>
-      <li><a href="ammico.html#utils.dump_df">dump_df() (in module utils)</a>
 </li>
  </ul></td>
 </tr></table>
@ -214,18 +180,10 @@
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
      <li><a href="ammico.html#faces.EmotionDetector">EmotionDetector (class in faces)</a>
-</li>
-      <li><a href="ammico.html#faces.ethical_disclosure">ethical_disclosure() (in module faces)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_basic">extract_image_features_basic() (multimodal_search.MultimodalSearch method)</a>
 </li>
  </ul></td>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_blip2">extract_image_features_blip2() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_clip">extract_image_features_clip() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.extract_text_features">extract_text_features() (multimodal_search.MultimodalSearch method)</a>
+      <li><a href="ammico.html#faces.ethical_disclosure">ethical_disclosure() (in module faces)</a>
 </li>
  </ul></td>
 </tr></table>
@ -243,50 +201,6 @@
  </ul></td>
  <td style="width: 33%; vertical-align: top;"><ul>
      <li><a href="ammico.html#faces.EmotionDetector.facial_expression_analysis">facial_expression_analysis() (faces.EmotionDetector method)</a>
-</li>
-      <li><a href="ammico.html#utils.find_files">find_files() (in module utils)</a>
-</li>
-  </ul></td>
-</tr></table>
-
-<h2 id="G">G</h2>
-<table style="width: 100%" class="indextable genindextable"><tr>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#utils.DownloadResource.get">get() (utils.DownloadResource method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.get_att_map">get_att_map() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#utils.get_color_table">get_color_table() (in module utils)</a>
-</li>
-      <li><a href="ammico.html#utils.get_dataframe">get_dataframe() (in module utils)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.get_pathes_from_query">get_pathes_from_query() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#text.PostprocessText.get_text_df">get_text_df() (text.PostprocessText method)</a>
-</li>
-      <li><a href="ammico.html#text.PostprocessText.get_text_dict">get_text_dict() (text.PostprocessText method)</a>
-</li>
-      <li><a href="ammico.html#text.TextDetector.get_text_from_image">get_text_from_image() (text.TextDetector method)</a>
-</li>
-  </ul></td>
-</tr></table>
-
-<h2 id="I">I</h2>
-<table style="width: 100%" class="indextable genindextable"><tr>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.image_text_match_reordering">image_text_match_reordering() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#utils.initialize_dict">initialize_dict() (in module utils)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#utils.is_interactive">is_interactive() (in module utils)</a>
-</li>
-      <li><a href="ammico.html#utils.iterable">iterable() (in module utils)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.itm_text_precessing">itm_text_precessing() (multimodal_search.MultimodalSearch method)</a>
 </li>
  </ul></td>
 </tr></table>
@ -302,32 +216,20 @@
 <h2 id="L">L</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_albef">load_feature_extractor_model_albef() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip">load_feature_extractor_model_blip() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip2">load_feature_extractor_model_blip2() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_base">load_feature_extractor_model_clip_base() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14">load_feature_extractor_model_clip_vitl14() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14_336">load_feature_extractor_model_clip_vitl14_336() (multimodal_search.MultimodalSearch method)</a>
-</li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model">load_model() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_base">load_model_base() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_base_blip2_opt_caption_coco_opt67b">load_model_base_blip2_opt_caption_coco_opt67b() (summary.SummaryDetector method)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_base_blip2_opt_pretrain_opt67b">load_model_base_blip2_opt_pretrain_opt67b() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_blip2_opt_caption_coco_opt27b">load_model_blip2_opt_caption_coco_opt27b() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_blip2_opt_pretrain_opt27b">load_model_blip2_opt_pretrain_opt27b() (summary.SummaryDetector method)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_blip2_t5_caption_coco_flant5xl">load_model_blip2_t5_caption_coco_flant5xl() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_model_blip2_t5_pretrain_flant5xl">load_model_blip2_t5_pretrain_flant5xl() (summary.SummaryDetector method)</a>
@ -337,8 +239,6 @@
      <li><a href="ammico.html#summary.SummaryDetector.load_model_large">load_model_large() (summary.SummaryDetector method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_new_model">load_new_model() (summary.SummaryDetector method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.load_tensors">load_tensors() (multimodal_search.MultimodalSearch method)</a>
 </li>
      <li><a href="ammico.html#summary.SummaryDetector.load_vqa_model">load_vqa_model() (summary.SummaryDetector method)</a>
 </li>
@ -357,58 +257,19 @@
        <li><a href="ammico.html#module-colors">colors</a>
 </li>
        <li><a href="ammico.html#module-cropposts">cropposts</a>
-</li>
-        <li><a href="ammico.html#module-display">display</a>
 </li>
        <li><a href="ammico.html#module-faces">faces</a>
-</li>
-        <li><a href="ammico.html#module-multimodal_search">multimodal_search</a>
 </li>
        <li><a href="ammico.html#module-summary">summary</a>
-</li>
-        <li><a href="ammico.html#module-text">text</a>
-</li>
-        <li><a href="ammico.html#module-utils">utils</a>
 </li>
      </ul></li>
  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.multimodal_device">multimodal_device (multimodal_search.MultimodalSearch attribute)</a>
-</li>
-      <li>
-    multimodal_search
-
-      <ul>
-        <li><a href="ammico.html#module-multimodal_search">module</a>
-</li>
-      </ul></li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.multimodal_search">multimodal_search() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch">MultimodalSearch (class in multimodal_search)</a>
-</li>
-  </ul></td>
 </tr></table>

 <h2 id="P">P</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.parsing_images">parsing_images() (multimodal_search.MultimodalSearch method)</a>
-</li>
      <li><a href="ammico.html#cropposts.paste_image_and_comment">paste_image_and_comment() (in module cropposts)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#text.PostprocessText">PostprocessText (class in text)</a>
-</li>
-      <li><a href="ammico.html#text.privacy_disclosure">privacy_disclosure() (in module text)</a>
-</li>
-  </ul></td>
-</tr></table>
-
-<h2 id="Q">Q</h2>
-<table style="width: 100%" class="indextable genindextable"><tr>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.querys_processing">querys_processing() (multimodal_search.MultimodalSearch method)</a>
 </li>
  </ul></td>
 </tr></table>
@ -416,25 +277,7 @@
 <h2 id="R">R</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.read_and_process_images">read_and_process_images() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.read_and_process_images_itm">read_and_process_images_itm() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#text.TextAnalyzer.read_csv">read_csv() (text.TextAnalyzer method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.read_img">read_img() (multimodal_search.MultimodalSearch method)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#text.TextDetector.remove_linebreaks">remove_linebreaks() (text.TextDetector method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.resize_img">resize_img() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#utils.DownloadResource.resources">resources (utils.DownloadResource attribute)</a>
-</li>
      <li><a href="ammico.html#colors.ColorDetector.rgb2name">rgb2name() (colors.ColorDetector method)</a>
-</li>
-      <li><a href="ammico.html#display.AnalysisExplorer.run_server">run_server() (display.AnalysisExplorer method)</a>
 </li>
  </ul></td>
 </tr></table>
@ -442,22 +285,14 @@
 <h2 id="S">S</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.save_tensors">save_tensors() (multimodal_search.MultimodalSearch method)</a>
-</li>
      <li><a href="ammico.html#colors.ColorDetector.set_keys">set_keys() (colors.ColorDetector method)</a>

      <ul>
        <li><a href="ammico.html#faces.EmotionDetector.set_keys">(faces.EmotionDetector method)</a>
-</li>
-        <li><a href="ammico.html#text.TextDetector.set_keys">(text.TextDetector method)</a>
-</li>
-        <li><a href="ammico.html#utils.AnalysisMethod.set_keys">(utils.AnalysisMethod method)</a>
 </li>
      </ul></li>
  </ul></td>
  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.show_results">show_results() (multimodal_search.MultimodalSearch method)</a>
-</li>
      <li>
    summary

@ -470,56 +305,6 @@
  </ul></td>
 </tr></table>

-<h2 id="T">T</h2>
-<table style="width: 100%" class="indextable genindextable"><tr>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li>
-    text
-
-      <ul>
-        <li><a href="ammico.html#module-text">module</a>
-</li>
-      </ul></li>
-      <li><a href="ammico.html#text.TextDetector.text_ner">text_ner() (text.TextDetector method)</a>
-</li>
-      <li><a href="ammico.html#text.TextDetector.text_sentiment_transformers">text_sentiment_transformers() (text.TextDetector method)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#text.TextDetector.text_summary">text_summary() (text.TextDetector method)</a>
-</li>
-      <li><a href="ammico.html#text.TextAnalyzer">TextAnalyzer (class in text)</a>
-</li>
-      <li><a href="ammico.html#text.TextDetector">TextDetector (class in text)</a>
-</li>
-      <li><a href="ammico.html#text.TextDetector.translate_text">translate_text() (text.TextDetector method)</a>
-</li>
-  </ul></td>
-</tr></table>
-
-<h2 id="U">U</h2>
-<table style="width: 100%" class="indextable genindextable"><tr>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#display.AnalysisExplorer.update_picture">update_picture() (display.AnalysisExplorer method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip2_coco">upload_model_blip2_coco() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip_base">upload_model_blip_base() (multimodal_search.MultimodalSearch method)</a>
-</li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip_large">upload_model_blip_large() (multimodal_search.MultimodalSearch method)</a>
-</li>
-      <li>
-    utils
-
-      <ul>
-        <li><a href="ammico.html#module-utils">module</a>
-</li>
-      </ul></li>
-  </ul></td>
-</tr></table>
-
 <h2 id="W">W</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
  <td style="width: 33%; vertical-align: top;"><ul>
--- a/build/html/index.html
+++ b/build/html/index.html
@ -127,12 +127,12 @@
 <li class="toctree-l1"><a class="reference internal" href="modules.html">AMMICO package modules</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html">text module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-summary">summary module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-multimodal_search">multimodal search module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#multimodal-search-module">multimodal search module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-faces">faces module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-colors">color_analysis module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-cropposts">cropposts module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-utils">utils module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-display">display module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils-module">utils module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#display-module">display module</a></li>
 </ul>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="license_link.html">License</a></li>
--- a/build/html/modules.html
+++ b/build/html/modules.html
@ -56,12 +56,12 @@
 <li class="toctree-l1 current"><a class="current reference internal" href="#">AMMICO package modules</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html">text module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-summary">summary module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-multimodal_search">multimodal search module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#multimodal-search-module">multimodal search module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-faces">faces module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-colors">color_analysis module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#module-cropposts">cropposts module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-utils">utils module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#module-display">display module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils-module">utils module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="ammico.html#display-module">display module</a></li>
 </ul>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="license_link.html">License</a></li>
@ -95,32 +95,7 @@
 <h1>AMMICO package modules<a class="headerlink" href="#ammico-package-modules" title="Link to this heading"></a></h1>
 <div class="toctree-wrapper compound">
 <ul>
-<li class="toctree-l1"><a class="reference internal" href="ammico.html">text module</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#text.PostprocessText"><code class="docutils literal notranslate"><span class="pre">PostprocessText</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.PostprocessText.analyse_topic"><code class="docutils literal notranslate"><span class="pre">PostprocessText.analyse_topic()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.PostprocessText.get_text_df"><code class="docutils literal notranslate"><span class="pre">PostprocessText.get_text_df()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.PostprocessText.get_text_dict"><code class="docutils literal notranslate"><span class="pre">PostprocessText.get_text_dict()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#text.TextAnalyzer"><code class="docutils literal notranslate"><span class="pre">TextAnalyzer</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextAnalyzer.read_csv"><code class="docutils literal notranslate"><span class="pre">TextAnalyzer.read_csv()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#text.TextDetector"><code class="docutils literal notranslate"><span class="pre">TextDetector</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.analyse_image"><code class="docutils literal notranslate"><span class="pre">TextDetector.analyse_image()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.clean_text"><code class="docutils literal notranslate"><span class="pre">TextDetector.clean_text()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.get_text_from_image"><code class="docutils literal notranslate"><span class="pre">TextDetector.get_text_from_image()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.remove_linebreaks"><code class="docutils literal notranslate"><span class="pre">TextDetector.remove_linebreaks()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.set_keys"><code class="docutils literal notranslate"><span class="pre">TextDetector.set_keys()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.text_ner"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_ner()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.text_sentiment_transformers"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_sentiment_transformers()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.text_summary"><code class="docutils literal notranslate"><span class="pre">TextDetector.text_summary()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#text.TextDetector.translate_text"><code class="docutils literal notranslate"><span class="pre">TextDetector.translate_text()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#text.privacy_disclosure"><code class="docutils literal notranslate"><span class="pre">privacy_disclosure()</span></code></a></li>
-</ul>
-</li>
+<li class="toctree-l1"><a class="reference internal" href="ammico.html">text module</a></li>
 <li class="toctree-l1"><a class="reference internal" href="ammico.html#module-summary">summary module</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#summary.SummaryDetector"><code class="docutils literal notranslate"><span class="pre">SummaryDetector</span></code></a><ul>
 <li class="toctree-l3"><a class="reference internal" href="ammico.html#summary.SummaryDetector.all_allowed_model_types"><code class="docutils literal notranslate"><span class="pre">SummaryDetector.all_allowed_model_types</span></code></a></li>
@ -147,41 +122,7 @@
 </li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="ammico.html#module-multimodal_search">multimodal search module</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.compute_gradcam_batch"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.compute_gradcam_batch()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_basic"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_basic()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_blip2"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_blip2()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.extract_image_features_clip"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_image_features_clip()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.extract_text_features"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.extract_text_features()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.get_att_map"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.get_att_map()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.get_pathes_from_query"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.get_pathes_from_query()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.image_text_match_reordering"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.image_text_match_reordering()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.itm_text_precessing"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.itm_text_precessing()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_albef"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_albef()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_blip()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_blip2"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_blip2()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_base"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_base()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_vitl14()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_feature_extractor_model_clip_vitl14_336"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_feature_extractor_model_clip_vitl14_336()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.load_tensors"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.load_tensors()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.multimodal_device"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.multimodal_device</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.multimodal_search"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.multimodal_search()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.parsing_images"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.parsing_images()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.querys_processing"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.querys_processing()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.read_and_process_images"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_and_process_images()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.read_and_process_images_itm"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_and_process_images_itm()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.read_img"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.read_img()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.resize_img"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.resize_img()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.save_tensors"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.save_tensors()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.show_results"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.show_results()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip2_coco"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip2_coco()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip_base"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip_base()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#multimodal_search.MultimodalSearch.upload_model_blip_large"><code class="docutils literal notranslate"><span class="pre">MultimodalSearch.upload_model_blip_large()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
+<li class="toctree-l1"><a class="reference internal" href="ammico.html#multimodal-search-module">multimodal search module</a></li>
 <li class="toctree-l1"><a class="reference internal" href="ammico.html#module-faces">faces module</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#faces.EmotionDetector"><code class="docutils literal notranslate"><span class="pre">EmotionDetector</span></code></a><ul>
 <li class="toctree-l3"><a class="reference internal" href="ammico.html#faces.EmotionDetector.analyse_image"><code class="docutils literal notranslate"><span class="pre">EmotionDetector.analyse_image()</span></code></a></li>
@ -217,36 +158,8 @@
 <li class="toctree-l2"><a class="reference internal" href="ammico.html#cropposts.paste_image_and_comment"><code class="docutils literal notranslate"><span class="pre">paste_image_and_comment()</span></code></a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="ammico.html#module-utils">utils module</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.AnalysisMethod"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#utils.AnalysisMethod.analyse_image"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod.analyse_image()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#utils.AnalysisMethod.set_keys"><code class="docutils literal notranslate"><span class="pre">AnalysisMethod.set_keys()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.DownloadResource"><code class="docutils literal notranslate"><span class="pre">DownloadResource</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#utils.DownloadResource.get"><code class="docutils literal notranslate"><span class="pre">DownloadResource.get()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#utils.DownloadResource.resources"><code class="docutils literal notranslate"><span class="pre">DownloadResource.resources</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.ammico_prefetch_models"><code class="docutils literal notranslate"><span class="pre">ammico_prefetch_models()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.append_data_to_dict"><code class="docutils literal notranslate"><span class="pre">append_data_to_dict()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.dump_df"><code class="docutils literal notranslate"><span class="pre">dump_df()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.find_files"><code class="docutils literal notranslate"><span class="pre">find_files()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.get_color_table"><code class="docutils literal notranslate"><span class="pre">get_color_table()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.get_dataframe"><code class="docutils literal notranslate"><span class="pre">get_dataframe()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.initialize_dict"><code class="docutils literal notranslate"><span class="pre">initialize_dict()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.is_interactive"><code class="docutils literal notranslate"><span class="pre">is_interactive()</span></code></a></li>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#utils.iterable"><code class="docutils literal notranslate"><span class="pre">iterable()</span></code></a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="ammico.html#module-display">display module</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="ammico.html#display.AnalysisExplorer"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer</span></code></a><ul>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#display.AnalysisExplorer.run_server"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer.run_server()</span></code></a></li>
-<li class="toctree-l3"><a class="reference internal" href="ammico.html#display.AnalysisExplorer.update_picture"><code class="docutils literal notranslate"><span class="pre">AnalysisExplorer.update_picture()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
+<li class="toctree-l1"><a class="reference internal" href="ammico.html#utils-module">utils module</a></li>
+<li class="toctree-l1"><a class="reference internal" href="ammico.html#display-module">display module</a></li>
 </ul>
 </div>
 </section>
--- a/build/html/notebooks/DemoNotebook_ammico.html
+++ b/build/html/notebooks/DemoNotebook_ammico.html
@ -525,7 +525,7 @@ directly on the right next to the image. This way, the user can directly inspect
 <section id="The-detector-modules">
 <h1>The detector modules<a class="headerlink" href="#The-detector-modules" title="Link to this heading"></a></h1>
 <p>The different detector modules with their options are explained in more detail in this section. ## Text detector Text on the images can be extracted using the <code class="docutils literal notranslate"><span class="pre">TextDetector</span></code> class (<code class="docutils literal notranslate"><span class="pre">text</span></code> module). The text is initally extracted using the Google Cloud Vision API and then translated into English with googletrans. The translated text is cleaned of whitespace, linebreaks, and numbers using Python syntax and spaCy.</p>
-<p><img alt="16198497eb4045f4ad60b4f6c5982307" class="no-scaled-link" src="../_images/text_detector.png" style="width: 800px;" /></p>
+<p><img alt="6533bc572b3440f4bd6993055cd4e14b" class="no-scaled-link" src="../_images/text_detector.png" style="width: 800px;" /></p>
 <p>The user can set if the text should be further summarized, and analyzed for sentiment and named entity recognition, by setting the keyword <code class="docutils literal notranslate"><span class="pre">analyse_text</span></code> to <code class="docutils literal notranslate"><span class="pre">True</span></code> (the default is <code class="docutils literal notranslate"><span class="pre">False</span></code>). If set, the transformers pipeline is used for each of these tasks, with the default models as of 03/2023. Other models can be selected by setting the optional keyword <code class="docutils literal notranslate"><span class="pre">model_names</span></code> to a list of selected models, on for each task:
 <code class="docutils literal notranslate"><span class="pre">model_names=[&quot;sshleifer/distilbart-cnn-12-6&quot;,</span> <span class="pre">&quot;distilbert-base-uncased-finetuned-sst-2-english&quot;,</span> <span class="pre">&quot;dbmdz/bert-large-cased-finetuned-conll03-english&quot;]</span></code> for summary, sentiment, and ner. To be even more specific, revision numbers can also be selected by specifying the optional keyword <code class="docutils literal notranslate"><span class="pre">revision_numbers</span></code> to a list of revision numbers for each model, for example <code class="docutils literal notranslate"><span class="pre">revision_numbers=[&quot;a4f8f3e&quot;,</span> <span class="pre">&quot;af0f99b&quot;,</span> <span class="pre">&quot;f2482bf&quot;]</span></code>.</p>
 <p>Please note that for the Google Cloud Vision API (the TextDetector class) you need to set a key in order to process the images. This key is ideally set as an environment variable using for example</p>
@ -617,7 +617,7 @@ directly on the right next to the image. This way, the user can directly inspect
 <section id="Image-summary-and-query">
 <h2>Image summary and query<a class="headerlink" href="#Image-summary-and-query" title="Link to this heading"></a></h2>
 <p>The <code class="docutils literal notranslate"><span class="pre">SummaryDetector</span></code> can be used to generate image captions (<code class="docutils literal notranslate"><span class="pre">summary</span></code>) as well as visual question answering (<code class="docutils literal notranslate"><span class="pre">VQA</span></code>).</p>
-<p><img alt="3fb268ddbb264d588dfd98f3ce7ea01c" class="no-scaled-link" src="../_images/summary_detector.png" style="width: 800px;" /></p>
+<p><img alt="75bdd327eac04e4c98c28c0cf24f23de" class="no-scaled-link" src="../_images/summary_detector.png" style="width: 800px;" /></p>
 <p>This module is based on the <a class="reference external" href="https://github.com/salesforce/LAVIS">LAVIS</a> library. Since the models can be quite large, an initial object is created which will load the necessary models into RAM/VRAM and then use them in the analysis. The user can specify the type of analysis to be performed using the <code class="docutils literal notranslate"><span class="pre">analysis_type</span></code> keyword. Setting it to <code class="docutils literal notranslate"><span class="pre">summary</span></code> will generate a caption (summary), <code class="docutils literal notranslate"><span class="pre">questions</span></code> will prepare answers (VQA) to a list of questions as set by the user,
 <code class="docutils literal notranslate"><span class="pre">summary_and_questions</span></code> will do both. Note that the desired analysis type needs to be set here in the initialization of the detector object, and not when running the analysis for each image; the same holds true for the selected model.</p>
 <p>The implemented models are listed below.</p>
@ -880,7 +880,7 @@ directly on the right next to the image. This way, the user can directly inspect
 <section id="Detection-of-faces-and-facial-expression-analysis">
 <h2>Detection of faces and facial expression analysis<a class="headerlink" href="#Detection-of-faces-and-facial-expression-analysis" title="Link to this heading"></a></h2>
 <p>Faces and facial expressions are detected and analyzed using the <code class="docutils literal notranslate"><span class="pre">EmotionDetector</span></code> class from the <code class="docutils literal notranslate"><span class="pre">faces</span></code> module. Initially, it is detected if faces are present on the image using RetinaFace, followed by analysis if face masks are worn (Face-Mask-Detection). The probabilistic detection of age, gender, race, and emotions is carried out with deepface, but only if the disclosure statement has been accepted (see above).</p>
-<p><img alt="daedcb678fe24acf9e1316b1b9bf03aa" class="no-scaled-link" src="../_images/emotion_detector.png" style="width: 800px;" /></p>
+<p><img alt="fa3aebcfc94e45588bcfc17b53fcaf60" class="no-scaled-link" src="../_images/emotion_detector.png" style="width: 800px;" /></p>
 <p>Depending on the features found on the image, the face detection module returns a different analysis content: If no faces are found on the image, all further steps are skipped and the result <code class="docutils literal notranslate"><span class="pre">&quot;face&quot;:</span> <span class="pre">&quot;No&quot;,</span> <span class="pre">&quot;multiple_faces&quot;:</span> <span class="pre">&quot;No&quot;,</span> <span class="pre">&quot;no_faces&quot;:</span> <span class="pre">0,</span> <span class="pre">&quot;wears_mask&quot;:</span> <span class="pre">[&quot;No&quot;],</span> <span class="pre">&quot;age&quot;:</span> <span class="pre">[None],</span> <span class="pre">&quot;gender&quot;:</span> <span class="pre">[None],</span> <span class="pre">&quot;race&quot;:</span> <span class="pre">[None],</span> <span class="pre">&quot;emotion&quot;:</span> <span class="pre">[None],</span> <span class="pre">&quot;emotion</span> <span class="pre">(category)&quot;:</span> <span class="pre">[None]</span></code> is returned. If one or several faces are found, up to three faces are analyzed if they are partially concealed by a face mask. If
 yes, only age and gender are detected; if no, also race, emotion, and dominant emotion are detected. In case of the latter, the output could look like this: <code class="docutils literal notranslate"><span class="pre">&quot;face&quot;:</span> <span class="pre">&quot;Yes&quot;,</span> <span class="pre">&quot;multiple_faces&quot;:</span> <span class="pre">&quot;Yes&quot;,</span> <span class="pre">&quot;no_faces&quot;:</span> <span class="pre">2,</span> <span class="pre">&quot;wears_mask&quot;:</span> <span class="pre">[&quot;No&quot;,</span> <span class="pre">&quot;No&quot;],</span> <span class="pre">&quot;age&quot;:</span> <span class="pre">[27,</span> <span class="pre">28],</span> <span class="pre">&quot;gender&quot;:</span> <span class="pre">[&quot;Man&quot;,</span> <span class="pre">&quot;Man&quot;],</span> <span class="pre">&quot;race&quot;:</span> <span class="pre">[&quot;asian&quot;,</span> <span class="pre">None],</span> <span class="pre">&quot;emotion&quot;:</span> <span class="pre">[&quot;angry&quot;,</span> <span class="pre">&quot;neutral&quot;],</span> <span class="pre">&quot;emotion</span> <span class="pre">(category)&quot;:</span> <span class="pre">[&quot;Negative&quot;,</span> <span class="pre">&quot;Neutral&quot;]</span></code>, where for the two faces that are detected (given by <code class="docutils literal notranslate"><span class="pre">no_faces</span></code>), some of the values are returned as a list
 with the first item for the first (largest) face and the second item for the second (smaller) face (for example, <code class="docutils literal notranslate"><span class="pre">&quot;emotion&quot;</span></code> returns a list <code class="docutils literal notranslate"><span class="pre">[&quot;angry&quot;,</span> <span class="pre">&quot;neutral&quot;]</span></code> signifying the first face expressing anger, and the second face having a neutral expression).</p>
--- a/build/html/objects.inv
+++ b/build/html/objects.inv
--- a/build/html/py-modindex.html
+++ b/build/html/py-modindex.html
@ -89,12 +89,8 @@

   <div class="modindex-jumpbox">
   <a href="#cap-c"><strong>c</strong></a> | 
-   <a href="#cap-d"><strong>d</strong></a> | 
   <a href="#cap-f"><strong>f</strong></a> | 
-   <a href="#cap-m"><strong>m</strong></a> | 
-   <a href="#cap-s"><strong>s</strong></a> | 
-   <a href="#cap-t"><strong>t</strong></a> | 
-   <a href="#cap-u"><strong>u</strong></a>
+   <a href="#cap-s"><strong>s</strong></a>
   </div>

   <table class="indextable modindextable">
@ -112,14 +108,6 @@
       <a href="ammico.html#module-cropposts"><code class="xref">cropposts</code></a></td><td>
       <em></em></td></tr>
     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
-     <tr class="cap" id="cap-d"><td></td><td>
-       <strong>d</strong></td><td></td></tr>
-     <tr>
-       <td></td>
-       <td>
-       <a href="ammico.html#module-display"><code class="xref">display</code></a></td><td>
-       <em></em></td></tr>
-     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
     <tr class="cap" id="cap-f"><td></td><td>
       <strong>f</strong></td><td></td></tr>
     <tr>
@ -128,14 +116,6 @@
       <a href="ammico.html#module-faces"><code class="xref">faces</code></a></td><td>
       <em></em></td></tr>
     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
-     <tr class="cap" id="cap-m"><td></td><td>
-       <strong>m</strong></td><td></td></tr>
-     <tr>
-       <td></td>
-       <td>
-       <a href="ammico.html#module-multimodal_search"><code class="xref">multimodal_search</code></a></td><td>
-       <em></em></td></tr>
-     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
     <tr class="cap" id="cap-s"><td></td><td>
       <strong>s</strong></td><td></td></tr>
     <tr>
@ -143,22 +123,6 @@
       <td>
       <a href="ammico.html#module-summary"><code class="xref">summary</code></a></td><td>
       <em></em></td></tr>
-     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
-     <tr class="cap" id="cap-t"><td></td><td>
-       <strong>t</strong></td><td></td></tr>
-     <tr>
-       <td></td>
-       <td>
-       <a href="ammico.html#module-text"><code class="xref">text</code></a></td><td>
-       <em></em></td></tr>
-     <tr class="pcap"><td></td><td>&#160;</td><td></td></tr>
-     <tr class="cap" id="cap-u"><td></td><td>
-       <strong>u</strong></td><td></td></tr>
-     <tr>
-       <td></td>
-       <td>
-       <a href="ammico.html#module-utils"><code class="xref">utils</code></a></td><td>
-       <em></em></td></tr>
   </table>


--- a/build/html/searchindex.js
+++ b/build/html/searchindex.js