Как проверить, упорядочены ли два слова в python

Question

Как проверить, упорядочены ли два слова в python

1

что это за способ проверить, записаны ли два слова в предложении и сколько раз это происходит в python. Например: мне нравится есть маки суши, а лучшие суши - в Японии. слова: [маки, суши]

Благодарю.

Код

import re

x="I like to eat maki sushi and the best sushi is in Japan"
x1 = re.split('\W+',x)
l1 = [i for i,m in enumerate(x1) if m == "maki"]
l2 = [i for i,m in enumerate(x1) if m == "sushi"]


ordered = []
for i in l1:
    for j in l2: 
        if j == i+1:
            ordered.append((i,j))

print ordered

gizmo 29 авг. 2011, в 21:24

Источник

5

любую попытку кода вы могли бы предоставить себе?
steabert 29 авг. 2011, в 18:57
1

добавлено, но не эффективно
gizmo 29 авг. 2011, в 19:17
0

Итак, вы хотите, чтобы «каждая пара индексов (x, y) была такой, чтобы x <y и x-е слово было« маки », а y-е слово -« суши »»? Или вы хотите, чтобы слова были последовательными? Или только что?
Karl Knechtel 30 авг. 2011, в 04:46
0

Как вы можете видеть в моем примере, они должны быть последовательными - у = х + 1
gizmo 30 авг. 2011, в 06:33

Показать ещё 2 комментария

Теги:

python

6 ответов

1

def ordered(string, words):
    pos = [string.index(word) for word in words]
    return pos == sorted(pos)

s = "I like to eat maki sushi and the best sushi is in Japan"
w =  ["maki", "sushi"]
ordered(s, w) #Returns True.

Не совсем самый эффективный способ сделать это, но проще понять.

Jakob Bowyer 29 авг. 2011, в 17:49

1

зачем использовать 'assert', если order уже возвращает bool?
Remi 29 авг. 2011, в 19:31
0

просто чтобы доказать, что он работает нормально, приведенный пример ДОЛЖЕН вернуть True. Утверждаю только, чтобы показать, что это не терпит неудачу
Jakob Bowyer 29 авг. 2011, в 19:35
0

ХОРОШО. Мне понравилось, что вы сделали функцию для этого, кстати. Но посмотрите наше обсуждение моего ответа : я думаю, вам нужно разделить предложение ...
Remi 29 авг. 2011, в 20:00
1

Это довольно неуместное использование assert . Просто используйте комментарий.
wim 30 авг. 2011, в 01:17
1

Хорошо. Я изменю это
Jakob Bowyer 30 авг. 2011, в 08:39

Показать ещё 3 комментария

1

s = 'I like to eat maki sushi and the best sushi is in Japan'

проверить заказ

indices = [s.split().index(w) for w in ['maki', 'sushi']]
sorted(indices) == indices

как считать

s.split().count('maki')

Примечание (на основе обсуждения ниже):

предположим, что предложение "Мне нравится маким больше, чем суши или маки". Понимая, что маким - другое слово, чем маки, слово maki помещается после суши и встречается только один раз в предложении. Чтобы обнаружить это и правильно подсчитать, предложение должно быть разделено на пробелы на фактические слова.

Remi 29 авг. 2011, в 16:43

0

Это слишком сложно?
Jakob Bowyer 29 авг. 2011, в 19:09
0

отредактировал: только что увидел, я поставил отсортированный (), где он не принадлежит ...
Remi 29 авг. 2011, в 19:12
0

Вы делаете s.split (). Index (w). Вам не нужно.
Jakob Bowyer 29 авг. 2011, в 19:13
0

да, вам нужно разделить: предположим, что предложение было «Мне нравится Макимор и Маки». слово «маки» появляется только один раз. Если не использовать split (), это будет считаться дважды
Remi 29 авг. 2011, в 19:30
1

.index занимает только первый экземпляр
Jakob Bowyer 29 авг. 2011, в 19:42
0

Правда. Поэтому подумайте: «Мне нравится макиморе больше, чем суши или маки». Маки помещается до или после суши? Кстати, .count () также должен предшествовать split, спасибо!
Remi 29 авг. 2011, в 19:50

Показать ещё 4 комментария

0

Регулярное решение :)

import re
sent = 'I like to eat maki sushi and the best sushi is in Japan'
words = sorted(['maki', 'sushi'])
assert re.search(r'\b%s\b' % r'\b.*\b'.join(words), sent)

eph 29 авг. 2011, в 18:03

0

Бах миру нужно меньше
Jakob Bowyer 29 авг. 2011, в 19:19
0

Форматирование% s менее перспективно, учитывая более новый метод string.format ()
Remi 29 авг. 2011, в 19:33

0

если res> 0: слова сортируются в предложении

words = ["sushi", "maki", "xxx"]
sorted_words = sorted(words)
sen = " I like to eat maki sushi and the best sushi is in Japan xxx";
ind = map(lambda x : sen.index(x), sorted_words)
res = reduce(lambda a, b: b-a, ind)

bpgergo 29 авг. 2011, в 17:46

0

Просто и идея, возможно, потребуется дополнительная работа

(sentence.index('maki') <= sentence.index('sushi')) == ('maki' <= 'sushi')

Facundo Casco 29 авг. 2011, в 17:06

0

Как насчет нескольких слов?
Jakob Bowyer 29 авг. 2011, в 19:33
0

index() даст вам самый низкий индекс. Это также вызовет ValueError если слово отсутствует в строке. Это будет работать только для самых простых случаев.
Facundo Casco 29 авг. 2011, в 19:50

Ещё вопросы

любую попытку кода вы могли бы предоставить себе?
Итак, вы хотите, чтобы «каждая пара индексов (x, y) была такой, чтобы x <y и x-е слово было« маки », а y-е слово -« суши »»? Или вы хотите, чтобы слова были последовательными? Или только что?
Как вы можете видеть в моем примере, они должны быть последовательными - у = х + 1
зачем использовать 'assert', если order уже возвращает bool?
просто чтобы доказать, что он работает нормально, приведенный пример ДОЛЖЕН вернуть True. Утверждаю только, чтобы показать, что это не терпит неудачу
ХОРОШО. Мне понравилось, что вы сделали функцию для этого, кстати. Но посмотрите наше обсуждение моего ответа : я думаю, вам нужно разделить предложение ...
Это довольно неуместное использование assert . Просто используйте комментарий.
отредактировал: только что увидел, я поставил отсортированный (), где он не принадлежит ...
Вы делаете s.split (). Index (w). Вам не нужно.
да, вам нужно разделить: предположим, что предложение было «Мне нравится Макимор и Маки». слово «маки» появляется только один раз. Если не использовать split (), это будет считаться дважды
.index занимает только первый экземпляр
Правда. Поэтому подумайте: «Мне нравится макиморе больше, чем суши или маки». Маки помещается до или после суши? Кстати, .count () также должен предшествовать split, спасибо!
Форматирование% s менее перспективно, учитывая более новый метод string.format ()
index() даст вам самый низкий индекс. Это также вызовет ValueError если слово отсутствует в строке. Это будет работать только для самых простых случаев.

eph · Accepted Answer · 2011-08-29T17-35-00.000Z

В соответствии с добавленным кодом вы подразумеваете, что слова смежны?

Почему бы просто не собрать их вместе:

print len(re.findall(r'\bmaki sushi\b', sent))

Нет, значит ОП по порядку, поэтому этот ответ бесполезен.
@jakob - спасибо, что это на самом деле решило мою проблему :) (я также разрешил "-" между двумя словами)