Извлечь номер из строки в Python без повторного

Question

Извлечь номер из строки в Python без повторного

1

Как я могу извлечь число из строки в python без использования регулярного выражения? Я видел isinstance но число может измениться почти на все. Есть идеи?

https://www.investopedia.com/articles/retirement/?page=6

Kamikaze_goldfish 20 сен. 2018, в 01:54

Источник

1

Ну, в этом случае вы просто читаете строку запроса ... разбираете ее и считываете параметр page ...
Jeff Mercado 19 сен. 2018, в 23:34
0

urlparse документация для разбора url
JETM 19 сен. 2018, в 23:36

Теги:

python

string

extract

int

5 ответов

2

Это немного многословно, но я бы использовал разбор URL для этого. Преимущество overy regex состоит в том, что вы получите некоторую проверку ввода для свободного и более читаемого кода.

>>> from urllib.parse import urlparse, parse_qs
>>> url = 'https://www.investopedia.com/articles/retirement/?page=6'
>>> parsed = urlparse(url)
>>> query = parse_qs(parsed.query)
>>> [page] = query['page']
>>> int(page)
6

wim 19 сен. 2018, в 21:04

1

Если url всегда имеет этот формат, и вы можете сделать это только с цифрами:

s = 'https://www.investopedia.com/articles/retirement/?page=25'
new = []
k = list(s)
[new.append(i) for i in k if i.isdigit()]
print(''.join(new))

(xenial)vash@localhost:~/python/stack_overflow$ python3.7 isdigit.py
25

vash_the_stampede 19 сен. 2018, в 21:32

1

Вы можете извлекать непрерывные группы цифр в любом месте строки, используя следующее:

from itertools import groupby

url = 'https://www.investopedia.com/articles/retirement/?page=6&limit=10&offset=15'
print([int(''.join(group)) for key, group in groupby(iterable=url, key=lambda e: e.isdigit()) if key])

Выход

[6, 10, 15]

Daniel Mesejo 19 сен. 2018, в 21:08

0

Я знаю, что вам не нужно re, но на самом деле это очень мощно. Под капотом большинство библиотек используют re. Вот мое решение для решения этой ситуации:

import re

url = "www.fake888.com/article/?article=123&page=9&group=8"

numbers = re.findall(r'(?<==)(\d+)', url)
print(f'Found: {" ".join(numbers)}')

varval = re.findall(r'(\w+)=(\d+)', url)
urldict = {}
for var in varval:
  urldict[var[0]] = var[1]

print(urldict)

Выход

Found: 123 9 8
{'article': '123', 'page': '9', 'group': '8'}

yoonghm 20 сен. 2018, в 03:05

0

Есть ли у вас хорошие ресурсы, чтобы помочь учиться?
Kamikaze_goldfish 20 сен. 2018, в 04:48
0

Я многому научился у rexegg.com
yoonghm 20 сен. 2018, в 04:50

Ещё вопросы

Ну, в этом случае вы просто читаете строку запроса ... разбираете ее и считываете параметр page ...
Есть ли у вас хорошие ресурсы, чтобы помочь учиться?

yvesva · Accepted Answer · 2018-09-19T22-00-00.000Z

0

Лучший ответ

Это предполагает, что не существует нескольких блоков целых чисел (например, www.something212.com/page=?13)

Вы можете попробовать использовать списки и str.isdigit()

url = 'https://www.investopedia.com/articles/retirement/?page=6'

digits = [d for d in url if d.isdigit()]

digit = ''.join(digits)

digit
>>> 6

Отредактировано: теперь работает с цифрами выше 9

yvesva 19 сен. 2018, в 22:00

1

что произойдет, если это 6 12?
vash_the_stampede 20 сен. 2018, в 00:10
0

цифры дадут [6,12] . Вы можете присоединиться к ответу, используя number = ''.join(map(int, digits))
yvesva 20 сен. 2018, в 00:20
0

Я знаю, я говорю, почему бы не указать это в своем ответе?
vash_the_stampede 20 сен. 2018, в 00:21
0

Вы можете просто ''.join(digits) так как вы уже знаете, что там
vash_the_stampede 20 сен. 2018, в 00:22
0

запуск ''.join(digits) в списке, содержащем целые числа, приводит к ошибке.
yvesva 20 сен. 2018, в 00:26
0

да, я не заметил, что вы привели их как int
vash_the_stampede 20 сен. 2018, в 00:28
0

Мне нравится это сейчас, выглядит как то, что я бы сделал :)
vash_the_stampede 20 сен. 2018, в 00:31
0

мне нравится это лучше, чем мое собственное решение
vash_the_stampede 20 сен. 2018, в 00:31
0

Пожалуйста, примите ответ, если он решил ваш запрос
yvesva 20 сен. 2018, в 00:35
1

@vash_the_stampede Я должен согласиться с тобой. Это довольно хороший кусок кода.
Kamikaze_goldfish 20 сен. 2018, в 01:16
0

@Kamikaze_goldfish да, он пропустил процесс добавления и получил тот же результат, очень приятно
vash_the_stampede 20 сен. 2018, в 01:18
0

@vash_the_stampede вы должны жить здесь
Kamikaze_goldfish 20 сен. 2018, в 01:19
0

@Kamikaze_goldfish ...;)
vash_the_stampede 20 сен. 2018, в 01:19
0

это предполагает, что весь URL и строка запроса не содержат никаких других цифр. это довольно необоснованное предположение.
wim 20 сен. 2018, в 01:20
0

@ обычно это не так. Если это произойдет, я вернусь и попробую ваш код. Я только что с моего компьютера, поэтому я не могу проверить это.
Kamikaze_goldfish 20 сен. 2018, в 01:24

Показать ещё 13 комментариев