Python-pipepipe висит с многопроцессорной обработкой

Я пытаюсь запустить boilerpipe с помощью Python multiprocessing. Выполнение этого для анализа RSS-каналов из нескольких источников. Проблема в том, что он зависает в одном из потоков после обработки некоторых ссылок. Весь поток работает, если я удаляю пул и запускаю его в цикле.

Вот мой многопроцессорный код:

proc_pool = Pool(processes=4)
for each_link in data:
    proc_pool.apply_async(process_link_for_feeds, args=(each_link, ), callback=store_results_to_db)
proc_pool.close()
proc_pool.join()

Это мой код boilerpipe, который вызывается внутри process_link_for_feeds():

def parse_using_bp(in_url):
    extracted_html = ""
    if ContentParser.url_skip_p.match(in_url):
        return extracted_html
    try:
        extractor = Extractor(extractor='ArticleExtractor', url=in_url)
        extracted_html = extractor.getHTML()
        del extractor
    except BaseException as e:
        print "Something wrong at Boilerpipe -->", in_url, "-->", e
        extracted_html = ""
    finally:
        return extracted_html

Я не знаю, почему он висит. Что-то не так в коде proc_pool?

import multiprocessing from multiprocessing.pool import ThreadPool # hidden ThreadPool class # ... proc_pool = ThreadPool(processes=4) # this is the only difference for each_link in data: proc_pool.apply_async(process_link_for_feeds, args=(each_link, ), callback=store_results_to_db) proc_pool.close() proc_pool.join()

Ответ 1