优化

2023-07-31 16:38:35 +08:00
parent c2f42942de
commit 6b328df85c
1 changed files with 142 additions and 0 deletions
--- a/engines/shaarli.py
+++ b/engines/shaarli.py
@@ -0,0 +1,142 @@
 # SPDX-License-Identifier: AGPL-3.0-or-later
 from collections.abc import Iterable
 from json import loads
 from urllib.parse import urlencode,quote
 from searx.utils import to_string, html_to_text
 import calendar
 import time
 import base64
 import jwt
 base_url = ''
 visibility = 'private'
 content_html_to_text = False
 title_html_to_text = False
 paging = False
 suggestion_query = ''
 shaarli_api_secret = ''
 cookies = {}
 headers = {
  'Authorization': ''
 }
 '''Some engines might offer different result based on cookies or headers.
 Possible use-case: To set safesearch cookie or header to moderate.'''
 # parameters for engines with paging support
 #
 # number of results on each page
 # (only needed if the site requires not a page number, but an offset)
 page_size = 1
 # number of the first page (usually 0 or 1)
 first_page_num = 1
 def iterate(iterable):
    if type(iterable) == dict:
        it = iterable.items()
    else:
        it = enumerate(iterable)
    for index, value in it:
        yield str(index), value
 def is_iterable(obj):
    if type(obj) == str:
        return False
    return isinstance(obj, Iterable)
 def parse(query):
    q = []
    for part in query.split('/'):
        if part == '':
            continue
        else:
            q.append(part)
    return q
 def do_query(data, q):
    ret = []
    if not q:
        return ret
    qkey = q[0]
    for key, value in iterate(data):
        if len(q) == 1:
            if key == qkey:
                ret.append(value)
            elif is_iterable(value):
                ret.extend(do_query(value, q))
        else:
            if not is_iterable(value):
                continue
            if key == qkey:
                ret.extend(do_query(value, q[1:]))
            else:
                ret.extend(do_query(value, q))
    return ret
 def query(data, query_string):
    q = parse(query_string)
    return do_query(data, q)
 def request(query, params):
    # 生成 shaarli 认证token
    encoded_token = jwt.encode(
        {'iat': calendar.timegm(time.gmtime())},
        shaarli_api_secret,
        algorithm='HS512',
    )
    search_url = base_url + '/api/v1/links?offset={pageno}&searchterm={query}&searchtags={tag}' + '&visibility=%s&limit=%d' % (visibility, page_size)
    headers['Authorization'] = 'Bearer %s' % encoded_token
    query = (urlencode({'q': query})[2:]).split(quote('#'))
    fp = {'query': query[0], 'tag': '+'.join(query[1:]) if len(query) > 1 else ''}
    if paging and search_url.find('{pageno}') >= 0:
        fp['pageno'] = (params['pageno'] - 1) * page_size
    params['cookies'].update(cookies)
    params['headers'].update(headers)
    params['url'] = search_url.format(**fp)
    params['query'] = query[0]
    return params
 def identity(arg):
    return arg
 def response(resp):
    results = []
    json = loads(resp.text)
    title_filter = html_to_text if title_html_to_text else identity
    content_filter = html_to_text if content_html_to_text else identity
    for url, title, content in zip(query(json, 'url'), query(json, 'title'), query(json, 'description')):
        results.append(
            {
                'url': to_string(url),
                'title': title_filter(to_string(title)),
                'content': content_filter(to_string(content)),
            }
        )
    if not suggestion_query:
        return results
    for suggestion in query(json, suggestion_query):
        results.append({'suggestion': suggestion})
    return results