Это может быть один из тех вопросов, которые трудно ответить, но здесь говорится:
Я не считаю себя программистом - но я хотел бы:-) Я узнал R, потому что я устал от spss, а потому, что друг познакомил меня с языком, поэтому я не полный незнакомца с логикой программирования.
Теперь я хотел бы изучить python - прежде всего, для очистки экрана и анализа текста, но также для написания webapps с Pylons или Django.
Итак: Как мне научиться экранировать скребок с помощью python? Я начал просматривать лоскутные документы, но я чувствую, что происходит много "магии" - в конце концов - я пытаясь учиться, а не просто.
С другой стороны: нет причин изобретать колесо, и если Scrapy будет экранировать выскакивание того, что Django принадлежит к веб-страницам, тогда это может стоить прыгать прямо в Scrapy. Как вы думаете?
О - BTW: вид скрипинга экрана: я хочу очистить газетные сайты (т.е. довольно сложные и большие) за упоминания политиков и т.д. - Это означает, что мне нужно будет ежедневно царапаться, постепенно и рекурсивно - и мне нужно регистрируйте результаты в виде базы данных, которые приводят меня к бонусу: все говорят о nonSQL DB. Должен ли я научиться использовать, например, mongoDB сразу (я не думаю, что мне нужна сильная последовательность), или это глупо для того, что я хочу делать?
Спасибо за любые мысли - и я приношу свои извинения, если это для общего, чтобы считаться вопросом программирования.