- Este tópico contém 2 respostas, 2 vozes e foi atualizado pela última vez 11 meses, 1 semana atrás por .
Visualizando 3 posts - 1 até 3 (de 3 do total)
Visualizando 3 posts - 1 até 3 (de 3 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Inteligência Artificial: Buscas em Textos com Python › Spyder: Funciona com alguns Crawl(s) e não funciona com um especifico
#Não funciona com a pagina: ‘https://www.investsite.com.br/’
import urllib3
from bs4 import BeautifulSoup
def crawl(pagina):
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
http=urllib3.PoolManager()
try:
dados_pagina = http.request(‘GET’, pagina)
except:
print(‘Erro abrindo pagina’ + pagina)
sopa=BeautifulSoup(dados_pagina.data, “lxml”)
links=sopa.find_all(‘a’)
for link in links:
print(str(link.contents) + “-” + str(link.get(‘href’)))
crawl(‘https://www.investsite.com.br’)
a url correta é: https://www.investsite.com.br
crawl(‘https://www.investsite.com.br’)
Apos ENVIAR o post, é adicionado o residuo 8#8217
Olá Jaime,
Se você clicar no link que termina com esse resíduo, vai ver que retorna uma mensagem de erro dizendo que ela não existe. Esta URL está incorreta.