(Apr-16-2021, 09:18 AM)lillo123 Wrote: Also, I have a lot of ul tag (about 48). Inside this tags, how can split starting each time using the value"Parti del fascicolo"?
"Parti del FAscicolo" it is the only way to understand that a new block is about to begin.
Can search for tag that contain text,and in case go up to parent tag
ul
when found.
Then this
ul
will have all
li
tag that has search word.
Example.
import requests
from bs4 import BeautifulSoup
url = 'https://mob.processotelematico.giustizia.it/proxy/index_mobile.php?version=1.1.11&platform=Android%208.0.0&uuid=137cd993b81df224&devicename=SM-G955F&token=c0ba723983c804d8eef1c9ee74cfcb99&azione=direttarg_siecic_mobile&tipoufficio=1®istro=PC&idufficio=0580910098&aaproc=2018&numproc=1&'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'lxml')
result = soup.select('li:-soup-contains("Parti fascicolo")')
Output:
>>> result
[<li data-role="list-divider">Parti fascicolo</li>,
<li data-role="list-divider">Parti fascicolo</li>,
<li data-role="list-divider">Parti fascicolo</li>,
<li data-role="list-divider">Parti fascicolo</li>,
<li data-role="list-divider">Parti fascicolo</li>,
<li data-role="list-divider">Parti fascicolo</li>]
At his stage has found all
Parti fascicolo
tag.
So now need to go to parent
ul
which will have block of tags that related to
Parti fascicolo
.
Output:
>>> result[0].find_parent('ul')
<ul data-dividertheme="e" data-inset="true" data-role="listview"><li data-role="list-divider">Parti fascicolo</li><li>L**** *****<i> (Debitore)</i><br/>Avv. P****** F*****</li></ul>
>>>
>>> result[2].find_parent('ul')
<ul data-dividertheme="e" data-inset="true" data-role="listview"><li data-role="list-divider">Parti fascicolo</li><li>M**** G****<i> (Creditore)</i></li><li>B**** S****<i> (Curatore)</i></li><li>E**** *****<i> (Debitore)</i></li><li>C**** S****<i> (Creditore)</i></li><li>C**** A****<i> (Creditore)</i></li><li>D**** G****<i> (Creditore)</i></li><li>D**** P****<i> (Creditore)</i></li><li>D**** M****<i> (Creditore)</i></li><li>D**** C****<i> (Creditore)</i></li><li>F**** F****<i> (Creditore)</i></li><li>F**** O****<i> (Creditore)</i></li><li>I**** C****<i> (Creditore)</i></li><li>L**** E****<i> (Creditore)</i></li><li>A**** *****<i> (Creditore)</i></li><li>C**** *****<i> (Creditore)</i></li><li>A**** C****<i> (Creditore)</i></li><li>A**** C****<i> (Creditore)</i></li><li>A**** A****<i> (Creditore)</i></li><li>A**** G****<i> (Creditore)</i></li><li>B**** S****<i> (Creditore)</i></li><li>B**** E****<i> (Creditore)</i></li><li>C**** V****<i> (Creditore)</i></li><li>C**** M****<i> (Creditore)</i></li><li>L**** M****<i> (Creditore)</i></li><li>L**** R****<i> (Creditore)</i></li><li>L**** M****<i> (Creditore)</i></li><li>R**** L****<i> (Creditore)</i></li><li>R**** C****<i> (Creditore)</i></li><li>V**** D****<i> (Creditore)</i></li><li>V**** E****<i> (Creditore)</i></li><li>A**** F****<i> (Creditore)</i></li><li>A**** F****<i> (Creditore)</i></li><li>A**** I****<i> (Creditore)</i></li><li>B**** G****<i> (Creditore)</i></li><li>C**** G****<i> (Creditore)</i></li><li>C**** M****<i> (Creditore)</i></li><li>C**** M****<i> (Creditore)</i></li><li>D**** M****<i> (Creditore)</i></li><li>D**** V****<i> (Creditore)</i></li><li>F**** R****<i> (Creditore)</i></li><li>G**** R****<i> (Creditore)</i></li><li>G**** F****<i> (Creditore)</i></li><li>G**** M****<i> (Creditore)</i></li><li>M**** G****<i> (Creditore)</i></li><li>P**** F****<i> (Creditore)</i></li><li>P**** S****<i> (Creditore)</i></li><li>R**** M****<i> (Creditore)</i></li><li>T**** C****<i> (Creditore)</i></li><li>D**** D****<i> (Creditore)</i></li><li>G**** V****<i> (Creditore)</i></li><li>V**** M****<i> (Creditore)</i></li><li>Z**** A****<i> (Creditore)</i></li><li>M**** F****<i> (Creditore)</i></li><li>M**** M****<i> (Creditore)</i></li><li>M**** A****<i> (Creditore)</i></li><li>M**** D****<i> (Creditore)</i></li><li>M**** G****<i> (Creditore)</i></li><li>M**** G****<i> (Creditore)</i></li><li>O**** D****<i> (Creditore)</i></li><li>P**** G****<i> (Creditore)</i></li><li>R**** E****<i> (Creditore)</i></li><li>R**** F****<i> (Creditore)</i></li><li>R**** R****<i> (Creditore)</i></li><li>T**** C****<i> (Creditore)</i></li><li>M**** C****<i> (Creditore)</i></li><li>B**** D****<i> (Creditore)</i></li><li>O**** V****<i> (Creditore)</i></li></ul>