Additional Hebrew support

Conversions to unicode (when needed) Removal of extra chars Addition of RTL Committer: Nitzan Arazi <nitnit> On branch master Changes to be committed: Conversions to unicode when needed (for hebrew only) Removal of extra chars (for hebrew only) Addition of RTL (for hebrew only) (use "git reset HEAD <file>..." to unstage) modified: bgl.cc
2024-12-18 07:24:07 +00:00 · 2011-06-04 20:51:48 +03:00 · 2011-06-04 20:51:48 +03:00 · 30996f14a9
parent 74ff3b80b5
commit 30996f14a9
1 changed files with 44 additions and 5 deletions
--- a/bgl.cc
+++ b/bgl.cc
@ -548,6 +548,9 @@ public:
    isCancelled.ref();
  }
  void fixHebString(string & hebStr); // Hebrew support
  void fixHebArticle(string & hebArticle); // Hebrew support
  ~BglArticleRequest()
  {
    isCancelled.ref();
@ -560,6 +563,27 @@ void BglArticleRequestRunnable::run()
  r.run();
 }
 void BglArticleRequest::fixHebString(string & hebStr) // Hebrew support - convert non-unicode to unicode
 {
  wstring hebWStr=Utf8::decode(hebStr);
  for (unsigned int i=0; i<hebWStr.size();i++)
  {
    if (hebWStr[i]>=224 && hebWStr[i]<=250) // Hebrew chars encoded ecoded as windows-1255 or ISO-8859-8
        hebWStr[i]+=1488-224; // Convert to Hebrew unicode
  }
  hebStr=Utf8::encode(hebWStr);
 }
 void BglArticleRequest::fixHebArticle(string & hebArticle) // Hebrew support - remove extra chars at the end
 {
  int nulls=hebArticle.size()-1;
  while ((hebArticle[nulls]<=32 && hebArticle[nulls]>=0) || (hebArticle[nulls]>=65 && hebArticle[nulls]<=90)) //special chars and A-Z
  {
    nulls--;
  }
    hebArticle.erase (hebArticle.begin()+nulls+1, hebArticle.end());
 }
 void BglArticleRequest::run()
 {
  if ( isCancelled )
@ -570,6 +594,8 @@ void BglArticleRequest::run()
  vector< WordArticleLink > chain = dict.findArticles( word );
  static Language::Id hebrew = LangCoder::code2toInt( "he" ); // Hebrew support
  for( unsigned x = 0; x < alts.size(); ++x )
  {
    /// Make an additional query for each alt
@ -616,6 +642,15 @@ void BglArticleRequest::run()
    wstring headwordStripped =
      Folding::applySimpleCaseOnly( Utf8::decode( removePostfix( headword ) ) );
 	// Hebrew support - fix Hebrew text
    if (dict.idxHeader.langFrom == hebrew)
    {
        displayedHeadword= displayedHeadword.size() ? displayedHeadword : headword;
        fixHebString(articleText);
        fixHebArticle(articleText);
        fixHebString(displayedHeadword);
    }
    string const & targetHeadword = displayedHeadword.size() ?
                                    displayedHeadword : headword;
@ -652,12 +687,12 @@ void BglArticleRequest::run()
                   "</font>""</font>""</font>""</font>""</font>""</font>"
                   "</b></b></b></b></b></b></b></b>"
                   "</i></i></i></i></i></i></i></i>";
  static Language::Id hebrew = LangCoder::code2toInt( "he" );
  for( i = mainArticles.begin(); i != mainArticles.end(); ++i )
  {
-      result += "<h3>";
+      if (dict.idxHeader.langFrom == hebrew) // Hebrew support - format as RTL
        result += "<h3 style=\"text-align:right;direction:rtl\">";
      else
        result += "<h3>";
      result += postfixToSuperscript( i->second.first );
      result += "</h3>";
      if ( dict.idxHeader.langTo == hebrew )
@ -667,9 +702,13 @@ void BglArticleRequest::run()
      result += cleaner;
  }
  for( i = alternateArticles.begin(); i != alternateArticles.end(); ++i )
  {
-      result += "<h3>";
+      if (dict.idxHeader.langFrom == hebrew) // Hebrew support - format as RTL
        result += "<h3 style=\"text-align:right;direction:rtl\">";
      else
        result += "<h3>";
      result += postfixToSuperscript( i->second.first );
      result += "</h3>";
      if ( dict.idxHeader.langTo == hebrew )