Line data Source code
1 : /* -*- Mode: C++; tab-width: 4; indent-tabs-mode: nil; c-basic-offset: 4 -*- */
2 : /*
3 : * This file is part of the LibreOffice project.
4 : *
5 : * This Source Code Form is subject to the terms of the Mozilla Public
6 : * License, v. 2.0. If a copy of the MPL was not distributed with this
7 : * file, You can obtain one at http://mozilla.org/MPL/2.0/.
8 : *
9 : * This file incorporates work covered by the following license notice:
10 : *
11 : * Licensed to the Apache Software Foundation (ASF) under one or more
12 : * contributor license agreements. See the NOTICE file distributed
13 : * with this work for additional information regarding copyright
14 : * ownership. The ASF licenses this file to you under the Apache
15 : * License, Version 2.0 (the "License"); you may not use this file
16 : * except in compliance with the License. You may obtain a copy of
17 : * the License at http://www.apache.org/licenses/LICENSE-2.0 .
18 : */
19 :
20 : #include <comphelper/processfactory.hxx>
21 : #include <com/sun/star/ucb/Command.hpp>
22 : #include <com/sun/star/ucb/XCommandEnvironment.hpp>
23 : #include <com/sun/star/i18n/Transliteration.hpp>
24 : #include <com/sun/star/ucb/XCommandProcessor.hpp>
25 : #include <com/sun/star/lang/Locale.hpp>
26 : #include <com/sun/star/script/XInvocation.hpp>
27 :
28 : #include <helpcompiler/HelpSearch.hxx>
29 :
30 : #if defined _MSC_VER
31 : #pragma warning(push)
32 : #pragma warning(disable : 4068 4263 4264 4266)
33 : #endif
34 :
35 : #if defined(__GNUC__) && defined(HAVE_GCC_VISIBILITY_FEATURE)
36 : # pragma GCC visibility push (default)
37 : #endif
38 : #include <CLucene.h>
39 : #if defined(__GNUC__) && defined(HAVE_GCC_VISIBILITY_FEATURE)
40 : # pragma GCC visibility pop
41 : #endif
42 :
43 : #if defined _MSC_VER
44 : #pragma warning(pop)
45 : #endif
46 :
47 : #include <rtl/ustring.hxx>
48 :
49 : #include <algorithm>
50 : #include <set>
51 : #include <qe/Query.hxx>
52 : #include <qe/DocGenerator.hxx>
53 : #include "resultsetforquery.hxx"
54 : #include "databases.hxx"
55 :
56 : using namespace std;
57 : using namespace chelp;
58 : using namespace xmlsearch::excep;
59 : using namespace xmlsearch::qe;
60 : using namespace com::sun::star;
61 : using namespace com::sun::star::ucb;
62 : using namespace com::sun::star::i18n;
63 : using namespace com::sun::star::uno;
64 : using namespace com::sun::star::lang;
65 :
66 0 : struct HitItem
67 : {
68 : OUString m_aURL;
69 : float m_fScore;
70 :
71 : HitItem()
72 : : m_fScore(0.0)
73 : {}
74 0 : HitItem(const OUString& aURL, float fScore)
75 : : m_aURL(aURL)
76 0 : , m_fScore(fScore)
77 0 : {}
78 0 : bool operator < ( const HitItem& rHitItem ) const
79 : {
80 0 : return rHitItem.m_fScore < m_fScore;
81 : }
82 : };
83 :
84 0 : ResultSetForQuery::ResultSetForQuery( const uno::Reference< uno::XComponentContext >& rxContext,
85 : const uno::Reference< XContentProvider >& xProvider,
86 : sal_Int32 nOpenMode,
87 : const uno::Sequence< beans::Property >& seq,
88 : const uno::Sequence< NumberedSortingInfo >& seqSort,
89 : URLParameter& aURLParameter,
90 : Databases* pDatabases )
91 : : ResultSetBase( rxContext,xProvider,nOpenMode,seq,seqSort ),
92 0 : m_aURLParameter( aURLParameter )
93 : {
94 0 : Reference< XExtendedTransliteration > xTrans = Transliteration::create( rxContext );
95 : Locale aLocale( aURLParameter.get_language(),
96 : OUString(),
97 0 : OUString() );
98 0 : xTrans->loadModule(TransliterationModules_UPPERCASE_LOWERCASE,
99 0 : aLocale );
100 :
101 0 : vector< vector< OUString > > queryList;
102 : {
103 : sal_Int32 idx;
104 0 : OUString query = m_aURLParameter.get_query();
105 0 : while( !query.isEmpty() )
106 : {
107 0 : idx = query.indexOf( ' ' );
108 0 : if( idx == -1 )
109 0 : idx = query.getLength();
110 :
111 0 : vector< OUString > currentQuery;
112 0 : OUString tmp(query.copy( 0,idx ));
113 0 : rtl:: OUString toliterate = tmp;
114 0 : Sequence<sal_Int32> aSeq;
115 0 : toliterate = xTrans->transliterate(
116 0 : tmp,0,tmp.getLength(),aSeq);
117 :
118 0 : currentQuery.push_back( toliterate );
119 0 : queryList.push_back( currentQuery );
120 :
121 0 : int nCpy = 1 + idx;
122 0 : if( nCpy >= query.getLength() )
123 0 : query = OUString();
124 : else
125 0 : query = query.copy( 1 + idx );
126 0 : }
127 : }
128 :
129 0 : vector< OUString > aCompleteResultVector;
130 0 : OUString scope = m_aURLParameter.get_scope();
131 0 : bool bCaptionsOnly = scope.equalsAscii( "Heading" );
132 0 : sal_Int32 hitCount = m_aURLParameter.get_hitCount();
133 :
134 0 : IndexFolderIterator aIndexFolderIt( *pDatabases, m_aURLParameter.get_module(), m_aURLParameter.get_language() );
135 0 : OUString idxDir;
136 0 : bool bExtension = false;
137 0 : int iDir = 0;
138 0 : vector< vector<HitItem>* > aIndexFolderResultVectorVector;
139 :
140 : bool bTemporary;
141 0 : while( !(idxDir = aIndexFolderIt.nextIndexFolder( bExtension, bTemporary )).isEmpty() )
142 : {
143 0 : vector<HitItem> aIndexFolderResultVector;
144 :
145 : try
146 : {
147 0 : vector< vector<HitItem>* > aQueryListResultVectorVector;
148 0 : set< OUString > aSet,aCurrent,aResultSet;
149 :
150 0 : int nQueryListSize = queryList.size();
151 0 : if( nQueryListSize > 1 )
152 0 : hitCount = 2000;
153 :
154 0 : for( int i = 0; i < nQueryListSize; ++i )
155 : {
156 : vector<HitItem>* pQueryResultVector;
157 0 : if( nQueryListSize > 1 )
158 : {
159 0 : pQueryResultVector = new vector<HitItem>();
160 0 : aQueryListResultVectorVector.push_back( pQueryResultVector );
161 : }
162 : else
163 : {
164 0 : pQueryResultVector = &aIndexFolderResultVector;
165 : }
166 0 : pQueryResultVector->reserve( hitCount );
167 :
168 0 : OUString aLang = m_aURLParameter.get_language();
169 0 : const std::vector< OUString >& aListItem = queryList[i];
170 0 : OUString aNewQueryStr = aListItem[0];
171 :
172 0 : vector<float> aScoreVector;
173 0 : vector<OUString> aPathVector;
174 :
175 : try
176 : {
177 0 : HelpSearch searcher(aLang, idxDir);
178 0 : searcher.query(aNewQueryStr, bCaptionsOnly, aPathVector, aScoreVector);
179 : }
180 0 : catch (CLuceneError &e)
181 : {
182 : SAL_WARN("xmlhelp", "CLuceneError: " << e.what());
183 : }
184 :
185 0 : if( nQueryListSize > 1 )
186 0 : aSet.clear();
187 :
188 0 : for (unsigned j = 0; j < aPathVector.size(); ++j) {
189 0 : pQueryResultVector->push_back(HitItem(aPathVector[j], aScoreVector[j]));
190 0 : if (nQueryListSize > 1)
191 0 : aSet.insert(aPathVector[j]);
192 : }
193 :
194 : // intersect
195 0 : if( nQueryListSize > 1 )
196 : {
197 0 : if( i == 0 )
198 : {
199 0 : aResultSet = aSet;
200 : }
201 : else
202 : {
203 0 : aCurrent = aResultSet;
204 0 : aResultSet.clear();
205 : set_intersection( aSet.begin(),aSet.end(),
206 : aCurrent.begin(),aCurrent.end(),
207 0 : inserter(aResultSet,aResultSet.begin()));
208 : }
209 : }
210 0 : }
211 :
212 : // Combine results in aIndexFolderResultVector
213 0 : if( nQueryListSize > 1 )
214 : {
215 0 : for( int n = 0 ; n < nQueryListSize ; ++n )
216 : {
217 0 : vector<HitItem>* pQueryResultVector = aQueryListResultVectorVector[n];
218 0 : vector<HitItem>& rQueryResultVector = *pQueryResultVector;
219 :
220 0 : int nItemCount = rQueryResultVector.size();
221 0 : for( int i = 0 ; i < nItemCount ; ++i )
222 : {
223 0 : const HitItem& rItem = rQueryResultVector[ i ];
224 0 : if( (aResultSet.find( rItem.m_aURL )) != aResultSet.end() )
225 : {
226 0 : HitItem aItemCopy( rItem );
227 0 : aItemCopy.m_fScore /= nQueryListSize; // To get average score
228 0 : if( n == 0 )
229 : {
230 : // Use first pass to create entry
231 0 : aIndexFolderResultVector.push_back( aItemCopy );
232 : }
233 : else
234 : {
235 : // Find entry in vector
236 0 : int nCount = aIndexFolderResultVector.size();
237 0 : for( int j = 0 ; j < nCount ; ++j )
238 : {
239 0 : HitItem& rFindItem = aIndexFolderResultVector[ j ];
240 0 : if( rFindItem.m_aURL.equals( aItemCopy.m_aURL ) )
241 : {
242 0 : rFindItem.m_fScore += aItemCopy.m_fScore;
243 0 : break;
244 : }
245 : }
246 0 : }
247 : }
248 : }
249 :
250 0 : delete pQueryResultVector;
251 : }
252 :
253 0 : sort( aIndexFolderResultVector.begin(), aIndexFolderResultVector.end() );
254 : }
255 :
256 0 : vector<HitItem>* pIndexFolderHitItemVector = new vector<HitItem>( aIndexFolderResultVector );
257 0 : aIndexFolderResultVectorVector.push_back( pIndexFolderHitItemVector );
258 0 : aIndexFolderResultVector.clear();
259 : }
260 0 : catch (const Exception &e)
261 : {
262 : SAL_WARN("xmlhelp", "Exception: " << e.Message);
263 : }
264 :
265 0 : ++iDir;
266 :
267 0 : if( bTemporary )
268 0 : aIndexFolderIt.deleteTempIndexFolder( idxDir );
269 :
270 0 : } // Iterator
271 :
272 :
273 0 : int nVectorCount = aIndexFolderResultVectorVector.size();
274 0 : vector<HitItem>::size_type* pCurrentVectorIndex = new vector<HitItem>::size_type[nVectorCount];
275 0 : for( int j = 0 ; j < nVectorCount ; ++j )
276 0 : pCurrentVectorIndex[j] = 0;
277 :
278 0 : sal_Int32 nTotalHitCount = m_aURLParameter.get_hitCount();
279 0 : sal_Int32 nHitCount = 0;
280 0 : while( nHitCount < nTotalHitCount )
281 : {
282 0 : int iVectorWithBestScore = -1;
283 0 : float fBestScore = 0.0;
284 0 : for( int k = 0 ; k < nVectorCount ; ++k )
285 : {
286 0 : vector<HitItem>& rIndexFolderVector = *aIndexFolderResultVectorVector[k];
287 0 : if( pCurrentVectorIndex[k] < rIndexFolderVector.size() )
288 : {
289 0 : const HitItem& rItem = rIndexFolderVector[ pCurrentVectorIndex[k] ];
290 :
291 0 : if( fBestScore < rItem.m_fScore )
292 : {
293 0 : fBestScore = rItem.m_fScore;
294 0 : iVectorWithBestScore = k;
295 : }
296 : }
297 : }
298 :
299 0 : if( iVectorWithBestScore == -1 ) // No item left at all
300 0 : break;
301 :
302 0 : vector<HitItem>& rIndexFolderVector = *aIndexFolderResultVectorVector[iVectorWithBestScore];
303 0 : const HitItem& rItem = rIndexFolderVector[ pCurrentVectorIndex[iVectorWithBestScore] ];
304 :
305 0 : pCurrentVectorIndex[iVectorWithBestScore]++;
306 :
307 0 : aCompleteResultVector.push_back( rItem.m_aURL );
308 0 : ++nHitCount;
309 : }
310 :
311 0 : delete[] pCurrentVectorIndex;
312 0 : for( int n = 0 ; n < nVectorCount ; ++n )
313 : {
314 0 : vector<HitItem>* pIndexFolderVector = aIndexFolderResultVectorVector[n];
315 0 : delete pIndexFolderVector;
316 : }
317 :
318 0 : sal_Int32 replIdx = OUString( "#HLP#" ).getLength();
319 0 : OUString replWith = "vnd.sun.star.help://";
320 :
321 0 : int nResultCount = aCompleteResultVector.size();
322 0 : for( int r = 0 ; r < nResultCount ; ++r )
323 : {
324 0 : OUString aURL = aCompleteResultVector[r];
325 0 : OUString aResultStr = replWith + aURL.copy(replIdx);
326 0 : m_aPath.push_back( aResultStr );
327 0 : }
328 :
329 0 : m_aItems.resize( m_aPath.size() );
330 0 : m_aIdents.resize( m_aPath.size() );
331 :
332 0 : Command aCommand;
333 0 : aCommand.Name = "getPropertyValues";
334 0 : aCommand.Argument <<= m_sProperty;
335 :
336 0 : for( m_nRow = 0; sal::static_int_cast<sal_uInt32>( m_nRow ) < m_aPath.size(); ++m_nRow )
337 : {
338 0 : m_aPath[m_nRow] =
339 0 : m_aPath[m_nRow] +
340 0 : OUString( "?Language=" ) +
341 0 : m_aURLParameter.get_language() +
342 0 : OUString( "&System=" ) +
343 0 : m_aURLParameter.get_system();
344 :
345 0 : uno::Reference< XContent > content = queryContent();
346 0 : if( content.is() )
347 : {
348 0 : uno::Reference< XCommandProcessor > cmd( content,uno::UNO_QUERY );
349 0 : cmd->execute( aCommand,0,uno::Reference< XCommandEnvironment >( 0 ) ) >>= m_aItems[m_nRow]; //TODO: check return value of operator >>=
350 : }
351 0 : }
352 0 : m_nRow = 0xffffffff;
353 0 : }
354 :
355 : /* vim:set shiftwidth=4 softtabstop=4 expandtab: */
|