Additional Hebrew support

Conversions to unicode (when needed) Removal of extra chars Addition of RTL Committer: Nitzan Arazi <nitnit> On branch master Changes to be committed: Conversions to unicode when needed (for hebrew only) Removal of extra chars (for hebrew only) Addition of RTL (for hebrew only) (use "git reset HEAD <file>..." to unstage) modified: bgl.cc
2024-12-18 03:14:06 +00:00 · 2011-06-04 20:51:48 +03:00 · 2011-06-04 20:51:48 +03:00 · 30996f14a9
parent 74ff3b80b5
commit 30996f14a9
1 changed files with 44 additions and 5 deletions
--- a/bgl.cc
+++ b/bgl.cc
@ -548,6 +548,9 @@ public:
    isCancelled.ref();
  }

+  void fixHebString(string & hebStr); // Hebrew support
+  void fixHebArticle(string & hebArticle); // Hebrew support
+
  ~BglArticleRequest()
  {
    isCancelled.ref();
@ -560,6 +563,27 @@ void BglArticleRequestRunnable::run()
  r.run();
 }

+void BglArticleRequest::fixHebString(string & hebStr) // Hebrew support - convert non-unicode to unicode
+{
+  wstring hebWStr=Utf8::decode(hebStr);
+  for (unsigned int i=0; i<hebWStr.size();i++)
+  {
+    if (hebWStr[i]>=224 && hebWStr[i]<=250) // Hebrew chars encoded ecoded as windows-1255 or ISO-8859-8
+        hebWStr[i]+=1488-224; // Convert to Hebrew unicode
+  }
+  hebStr=Utf8::encode(hebWStr);
+}
+
+void BglArticleRequest::fixHebArticle(string & hebArticle) // Hebrew support - remove extra chars at the end
+{
+  int nulls=hebArticle.size()-1;
+  while ((hebArticle[nulls]<=32 && hebArticle[nulls]>=0) || (hebArticle[nulls]>=65 && hebArticle[nulls]<=90)) //special chars and A-Z
+  {
+    nulls--;
+  }
+    hebArticle.erase (hebArticle.begin()+nulls+1, hebArticle.end());
+}
+
 void BglArticleRequest::run()
 {
  if ( isCancelled )
@ -570,6 +594,8 @@ void BglArticleRequest::run()

  vector< WordArticleLink > chain = dict.findArticles( word );

+  static Language::Id hebrew = LangCoder::code2toInt( "he" ); // Hebrew support
+
  for( unsigned x = 0; x < alts.size(); ++x )
  {
    /// Make an additional query for each alt
@ -616,6 +642,15 @@ void BglArticleRequest::run()
    wstring headwordStripped =
      Folding::applySimpleCaseOnly( Utf8::decode( removePostfix( headword ) ) );

+	// Hebrew support - fix Hebrew text
+    if (dict.idxHeader.langFrom == hebrew)
+    {
+        displayedHeadword= displayedHeadword.size() ? displayedHeadword : headword;
+        fixHebString(articleText);
+        fixHebArticle(articleText);
+        fixHebString(displayedHeadword);
+    }
+
    string const & targetHeadword = displayedHeadword.size() ?
                                    displayedHeadword : headword;

@ -652,11 +687,11 @@ void BglArticleRequest::run()
                   "</font>""</font>""</font>""</font>""</font>""</font>"
                   "</b></b></b></b></b></b></b></b>"
                   "</i></i></i></i></i></i></i></i>";
-
-  static Language::Id hebrew = LangCoder::code2toInt( "he" );
-
  for( i = mainArticles.begin(); i != mainArticles.end(); ++i )
  {
+      if (dict.idxHeader.langFrom == hebrew) // Hebrew support - format as RTL
+        result += "<h3 style=\"text-align:right;direction:rtl\">";
+      else
        result += "<h3>";
      result += postfixToSuperscript( i->second.first );
      result += "</h3>";
@ -667,8 +702,12 @@ void BglArticleRequest::run()
      result += cleaner;
  }

+ 
  for( i = alternateArticles.begin(); i != alternateArticles.end(); ++i )
  {
+      if (dict.idxHeader.langFrom == hebrew) // Hebrew support - format as RTL
+        result += "<h3 style=\"text-align:right;direction:rtl\">";
+      else
        result += "<h3>";
      result += postfixToSuperscript( i->second.first );
      result += "</h3>";