Как бы вы посчитали вхождения строки (на самом деле символ) внутри строки?

Question

Как бы вы посчитали вхождения строки (на самом деле символ) внутри строки?

721

Я делаю что-то, где я понял, что хотел подсчитать, сколько / я мог найти в строке, а затем мне показалось, что есть несколько способов сделать это, но не мог решить, какой лучший (или самый простой),

На данный момент я собираюсь с чем-то вроде:

string source = "/once/upon/a/time/";
int count = source.Length - source.Replace("/", "").Length;

Но мне это совсем не нравится, какие-то участники?

Я действительно не хочу выкапывать RegEx для этого, не так ли?

Я знаю, что моя строка будет иметь термин, который я ищу, поэтому вы можете предположить, что...

Конечно, для строк, где длина> 1,

string haystack = "/once/upon/a/time";
string needle = "/";
int needleCount = ( haystack.Length - haystack.Replace(needle,"").Length ) / needle.Length;

inspite 12 фев. 2009, в 15:31

Источник

26

+1: я должен сказать, что это совсем другой способ считать. я удивлен результатами тестов :)
naveen 15 март 2012, в 15:26
4

Это не так уж и отличается ... это типичный способ реализации этой функциональности в SQL: LEN(ColumnToCheck) - LEN(REPLACE(ColumnToCheck,"N","")) .
Sheridan 15 янв. 2013, в 16:02
5

На самом деле вы должны разделить на "/".Length
Gerard 20 март 2013, в 20:13
3

Могу я спросить, что, по вашим требованиям, должно быть подсчитано для числа вхождений "//" в "/////"? 2 или 4?
Les 02 июнь 2014, в 13:11
1

использование регулярных выражений, вероятно, лучший способ сделать это
Adam Higgins 07 май 2015, в 22:52
0

что вы имеете в виду "выкопать RegEx", я думаю, что вы имели бы в виду то же самое в отношении Linq, поскольку это может быть более неясным и не может быть меньше накладных расходов, если таковые имеются?
barlop 14 янв. 2019, в 14:03

Показать ещё 4 комментария

Теги:

c#

string

29 ответов

143

string source = "/once/upon/a/time/";
int count = 0;
foreach (char c in source) 
  if (c == '/') count++;

Быть быстрее, чем source.Replace().

bobwienholt 12 фев. 2009, в 17:48

13

Вы могли бы получить незначительное улучшение, переключившись на for вместо foreach, но только чуть-чуть.
Mark 12 фев. 2009, в 18:13
14

Нет. Вопрос состоит в том, чтобы посчитать вхождение строки, а не символа.
YukiSakura 07 дек. 2015, в 09:47
0

@ Отметьте, что это должно быть быстрее - foreach создает объект перечислителя и вызывает некоторые методы для каждой итерации. И мы говорим только о крошечных, крошечных кусочках улучшения в любом случае
user3638471 08 апр. 2016, в 15:23
2

Это подсчет символов в строке. Название о подсчете строк в строке
Thomas Weller 26 авг. 2016, в 14:11
1

@Mark Только что проверил это с помощью цикла for, и это было на самом деле медленнее, чем при использовании foreach. Может быть из-за проверки границ? (Время составило 1,65 с против 2,05 на 5-миллионных итерациях.)
Measuring 13 дек. 2016, в 09:05
2

В то время как вопрос заключается в запросе строки внутри строки, пример задачи, опубликованной OP, на самом деле является всего лишь одним символом, и в этом случае я бы назвал этот ответ все еще допустимым решением, так как он показывает лучший способ (поиск по символу вместо поиска по строке) решить проблему под рукой.
Chad 23 фев. 2017, в 21:39

Показать ещё 4 комментария

124

int count = new Regex(Regex.Escape(needle)).Matches(haystack).Count;

Yet Another Code Maker 10 дек. 2010, в 17:15

6

+1 - В некоторых случаях вы можете добавить RegexOptions.IgnoreCase .
TrueWill 23 июнь 2014, в 19:31
3

разве это не невероятно низко?
Thomas Ayoub 16 март 2015, в 15:31
2

Накладные расходы в Regex не идеальны, плюс "я действительно не хочу копать RegEx для этого, не так ли?"
Chad 23 фев. 2017, в 21:40
0

может не захотеть Regex.Escape(...) поэтому new System.Text.RegularExpressions.Regex(needle).Matches(haystack).Count;
barlop 14 янв. 2019, в 08:57

Показать ещё 2 комментария

76

Если вы хотите иметь возможность поиска целых строк, а не только символов:

src.Select((c, i) => src.Substring(i)).Count(sub => sub.StartsWith(target))

Прочитайте как "для каждого символа в строке, возьмите оставшуюся часть строки, начиная с этого символа в качестве подстроки, посчитайте ее, если она начинается с целевой строки".

mquander 12 фев. 2009, в 16:49

1

Не уверен, как я могу объяснить это более четко, чем приведенное описание. Что смущает?
mquander 08 март 2012, в 20:17
46

СУПЕР МЕДЛЕННО! Попробовал его на странице HTML, и это заняло около 2 минут, в отличие от других методов на этой странице, которые заняли 2 секунды. Ответ был правильным; он был слишком медленным, чтобы его можно было использовать.
JohnB 20 июнь 2012, в 21:51
2

согласился, слишком медленно Я большой поклонник решений в стиле linq, но это просто нежизнеспособно.
Sprague 12 июль 2012, в 08:09
5

Обратите внимание, что причина, по которой это происходит так медленно, состоит в том, что он создает n строк, таким образом выделяя примерно n ^ 2/2 байта.
Peter Crabtree 07 фев. 2013, в 19:32
0

Очень медленно, но отвечает на заголовок вопроса (хотя тело вопроса отличается)
nawfal 25 апр. 2013, в 14:40
6

OutOfMemoryException выбрасывается для моих 210000 символов строки.
ender 13 сен. 2013, в 08:47
0

Это O (N ^ 2) конечно
Martin Capodici 19 окт. 2014, в 00:39
0

это, кажется, самый медленный, НО единственный, который соответствует моим потребностям! например, поиск строки "lol" в "lolololololol" должен привести к 6 случаям, тогда как все остальные методы здесь возвращают 3., поскольку они считаются как " lol o lol o lol ol"
cmxl 30 окт. 2015, в 14:31
0

src.Where((c, i) => src.Skip(i).Take(target.Length).SequenceEqual(target)).Count() меньше памяти и работает быстрее :)
EriF89 22 фев. 2019, в 15:00

Показать ещё 7 комментариев

58

Я провел некоторое исследование и обнаружил, что решение Ричарда Уотсона является самым быстрым в большинстве случаев. То, что таблица с результатами каждого решения в сообщении (кроме тех, которые используют Regex, потому что он генерирует исключения при анализе строки типа "test {test" )

    Name      | Short/char |  Long/char | Short/short| Long/short |  Long/long |
    Inspite   |         134|        1853|          95|        1146|         671|
    LukeH_1   |         346|        4490|         N/A|         N/A|         N/A|
    LukeH_2   |         152|        1569|         197|        2425|        2171|
Bobwienholt   |         230|        3269|         N/A|         N/A|         N/A|
Richard Watson|          33|         298|         146|         737|         543|
StefanosKargas|         N/A|         N/A|         681|       11884|       12486|

Вы можете видеть, что в случае нахождения числа вхождений коротких подстрок (1-5 символов) в короткой строке (10-50 символов) предпочтительным является исходный алгоритм.

Кроме того, для многосимвольной подстроки вы должны использовать следующий код (на основе решения Ричарда Уотсона)

int count = 0, n = 0;

if(substring != "")
{
    while ((n = source.IndexOf(substring, n, StringComparison.InvariantCulture)) != -1)
    {
        n += substring.Length;
        ++count;
    }
}

tsionyx 02 авг. 2012, в 09:24

0

Я собирался добавить свое собственное «низкоуровневое» решение (без создания подстрок, использования replace / split или какого-либо Regex / Linq), но ваше, возможно, даже лучше, чем мое (и, по крайней мере, короче). Спасибо!
Dan W 03 авг. 2012, в 20:03
0

Для решений Regex добавьте Regex.Escape(needle)
Thymine 14 июнь 2013, в 14:57
2

Просто чтобы указать на других, нужно искать значение поиска, если оно пустое, иначе вы попадете в бесконечный цикл.
WhoIsRich 30 май 2014, в 11:43
2

Может быть, это только я, но для source="aaa" substring="aa" я ожидал получить обратно 2, а не 1. Чтобы "исправить" это, измените n += substring.Length на n++
ytoledano 01 сен. 2016, в 20:35
0

Вы можете добавить флаг overlapped для соответствия вашему случаю, например так: overlapped=True;.... if(overlapped) {++n;} else {n += substring.Length;}
tsionyx 02 сен. 2016, в 11:40

Показать ещё 3 комментария

51

LINQ работает со всеми коллекциями, и поскольку строки являются всего лишь набором символов, как насчет этого симпатичного маленького однострочного интерфейса:

var count = source.Count(c => c == '/');

Убедитесь, что у вас есть using System.Linq; в верхней части файла кода, так как .Count - это метод расширения из этого пространства имен.

Judah Himango 12 фев. 2009, в 17:05

5

Стоит ли там использовать var? Есть ли шанс, что Count будет заменен чем-то, что не возвращает int?
Whatsit 12 фев. 2009, в 19:01
66

@Whatsit: вы можете печатать «var» только левой рукой, а «int» - обеими руками;)
Sean Bright 12 фев. 2009, в 22:05
1

Что ж, вы можете предпочесть int там. Я часто буду использовать var для локальных, даже если тип переменной очевиден. Личное предпочтение.
Judah Gabriel Himango 15 фев. 2009, в 23:24
6

все буквы int находятся в ключах home, а var - нет. эээ .. подожди, я использую Дворжак
Michael Buen 07 май 2010, в 14:40
0

Я не могу заставить его скомпилировать :( Не понимает ли Count на строках
Bohn 27 янв. 2012, в 16:36
2

@BDotA Убедитесь, что у вас есть «using System.Linq;» в верхней части вашего файла. Кроме того, intellisense может скрыть от вас вызов .Count, поскольку это строка. Несмотря на это, он будет компилироваться и работать просто отлично.
Judah Gabriel Himango 27 янв. 2012, в 19:25
2

@JudahGabrielHimango Я бы сказал, что var следует использовать, особенно когда тип переменной очевиден (и для краткости и согласованности)
EriF89 22 фев. 2019, в 15:03

Показать ещё 5 комментариев

46

string source = "/once/upon/a/time/";
int count = 0;
int n = 0;

while ((n = source.IndexOf('/', n)) != -1)
{
   n++;
   count++;
}

На моем компьютере это примерно на 2 секунды быстрее, чем решение для каждого персонажа для 50 миллионов итераций.

Версия 2013:

Измените строку на char [] и повторите ее. Сокращает еще одну секунду или два от общего времени для итераций 50 м!

char[] testchars = source.ToCharArray();
foreach (char c in testchars)
{
     if (c == '/')
         count++;
}

Это еще быстрее:

char[] testchars = source.ToCharArray();
int length = testchars.Length;
for (int n = 0; n < length; n++)
{
    if (testchars[n] == '/')
        count++;
}

Для хорошей меры повторение с конца массива до 0 кажется самым быстрым, примерно на 5%.

int length = testchars.Length;
for (int n = length-1; n >= 0; n--)
{
    if (testchars[n] == '/')
        count++;
}

Мне было интересно, почему это могло быть и было Googling вокруг (я помню что-то об обратном итерации быстрей), и натолкнулся на этот вопрос, который досадно использует строку для char []. Я думаю, что трюк в обратном направлении является новым в этом контексте.

Каков самый быстрый способ перебора отдельных символов в строке на С#?

Richard Watson 14 май 2011, в 20:42

1

Вы можете поместить source.IndexOf('/', n + 1) и потерять n++ и скобки while :) Также вместо символа поместите переменную string word = "/" .
neeKo 13 дек. 2012, в 04:59
1

Эй, Нико, зацени новые ответы. Хотя сделать подстроку переменной длины будет сложнее.
Richard Watson 19 фев. 2013, в 12:14
0

Я использовал нечто подобное, шагая по подстроке; пока я не понял, что у indexOf есть startIndex. Мне больше всего нравится первое решение, так как это хороший баланс между скоростью и объемом памяти.
Samir Banjanovic 30 сен. 2013, в 18:39
1

Я где-то читал, что быстрее итерировать в обратном направлении, потому что быстрее сравнивать значение с 0
reggaeguitar 25 фев. 2015, в 22:46
0

@RichardWatson Является ли ToCharArray дешевой операцией?
shitpoet 16 дек. 2018, в 09:51
0

@shitpoet да. Если вы посмотрите на базовый код, это нативный вызов. public char [] toCharArray () {... System.arraycopy (значение, 0, результат, 0, значение.длина); ...}
Richard Watson 18 дек. 2018, в 12:29

Показать ещё 4 комментария

44

Они оба работают только для односимвольных поисковых терминов...

countOccurences("the", "the answer is the answer");

int countOccurences(string needle, string haystack)
{
    return (haystack.Length - haystack.Replace(needle,"").Length) / needle.Length;
}

может оказаться лучше для более длинных игл...

Но должен быть более элегантный способ.:)

ZombieSheep 12 фев. 2009, в 16:09

0

Для учета многосимвольных замен. Без него подсчет «в» тесте является ключом »вернул бы 6.
ZombieSheep 12 фев. 2009, в 16:06
0

Сравнительный анализ и сравнение со строкой. Сплит-способ - работает примерно в 1,5 раза быстрее. Престижность.
Alex 09 март 2014, в 22:55

19

Edit:

source.Split('/').Length-1

Brian Rudolph 12 фев. 2009, в 19:17

2

Вот что я делаю. И source.Split(new[]{"//"}, StringSplitOptions.None).Count - 1 для source.Split(new[]{"//"}, StringSplitOptions.None).Count - 1 разделителей.
bzlm 12 окт. 2009, в 10:05
3

Это будет выполнять как минимум n выделений строк в куче, плюс (возможно) несколько переопределений массива - и все это только для подсчета? Чрезвычайно неэффективен, плохо масштабируется и никогда не должен использоваться в каком-либо важном коде.
Zar Shardan 13 дек. 2012, в 04:16

15

Regex.Matches( Regex.Escape(input),  "stringToMatch" ).Count

cederlof 19 июнь 2013, в 12:21

1

Это неверно, если входные данные содержат специальные символы regex ie | Там должен быть Regex.Escape (вход)
Esben Skov Pedersen 24 апр. 2015, в 07:10
1

Ответ обновлен, ура.
cederlof 24 апр. 2015, в 08:50

13

В С# хороший счетчик String SubString - это неожиданно сложный человек:

public static int CCount(String haystack, String needle)
{
    return haystack.Split(new[] { needle }, StringSplitOptions.None).Length - 1;
}

Dave 08 март 2016, в 16:08

1

Хорошее решение - и работает для строки тоже (не только символ)!
ChriPf 19 апр. 2016, в 06:20
0

Спасибо, слишком легко забыть некоторые тонкости обработки строк при смене языков - как это делают большинство из нас в наши дни!
Dave 28 апр. 2016, в 13:12
1

-1 потому что: знаете ли вы разницу между Count () и Count или Length? Если кто-то использует Count () вместо Count или Length, я получаю срабатывание. Count () создает IEnumerator, затем проходит через все вхождения IEnumerable, тогда как Count или Length уже задают свойства объекта, которые уже содержат желаемое количество, без необходимости перебирать все элементы.
aeroson 13 фев. 2017, в 19:04
0

Хорошее место, и что странно, что в моей библиотеке, откуда я взял функцию, я использую «Длина». Под редакцией!
Dave 14 фев. 2017, в 08:51

Показать ещё 2 комментария

11

string s = "65 fght 6565 4665 hjk";
int count = 0;
foreach (Match m in Regex.Matches(s, "65"))
  count++;

preetham 07 янв. 2011, в 17:39

20

или Regex.Matches (s, "65"). Количество ^ _ ^
Meta 28 июнь 2011, в 07:29

10

private int CountWords(string text, string word) {
    int count = (text.Length - text.Replace(word, "").Length) / word.Length;
    return count;
}

Поскольку исходное решение было самым быстрым для символов, я полагаю, оно также будет для строк. Итак, вот мой вклад.

В контексте: Я искал такие слова, как "failed" и "successed" в файле журнала.

Gr, Бен

Ben 15 март 2011, в 18:13

1

Только не передавайте пустую строку для переменной «слово» (ошибка деления на ноль).
Andrew Jens 09 март 2018, в 02:15

7

Для тех, кто хочет использовать метод расширения String,

вот что я использую, основываясь на лучших опубликованных ответах:

public static class StringExtension
{    
    /// <summary> Returns the number of occurences of a string within a string, optional comparison allows case and culture control. </summary>
    public static int Occurrences(this System.String input, string value, StringComparison stringComparisonType = StringComparison.Ordinal)
    {
        if (String.IsNullOrEmpty(value)) return 0;

        int count    = 0;
        int position = 0;

        while ((position = input.IndexOf(value, position, stringComparisonType)) != -1)
        {
            position += value.Length;
            count    += 1;
        }

        return count;
    }

    /// <summary> Returns the number of occurences of a single character within a string. </summary>
    public static int Occurrences(this System.String input, char value)
    {
        int count = 0;
        foreach (char c in input) if (c == value) count += 1;
        return count;
    }
}

WhoIsRich 10 июнь 2014, в 15:40

5

Я думаю, что самый простой способ сделать это - использовать регулярные выражения. Таким образом, вы можете получить тот же счетчик расчётов, что и myVar.Split('x'), но с настройкой нескольких символов.

string myVar = "do this to count the number of words in my wording so that I can word it up!";
int count = Regex.Split(myVar, "word").Length;

Beroc 01 май 2013, в 17:09

5

public static int GetNumSubstringOccurrences(string text, string search)
{
    int num = 0;
    int pos = 0;

    if (!string.IsNullOrEmpty(text) && !string.IsNullOrEmpty(search))
    {
        while ((pos = text.IndexOf(search, pos)) > -1)
        {
            num ++;
            pos += search.Length;
        }
    }
    return num;
}

user460847 28 фев. 2013, в 19:01

2

Строка в строке:

Найти "и т.д." в ".. JD JD JD JD и т.д. и т.д. JDJDJDJDJDJDJDJD и т.д."

var strOrigin = " .. JD JD JD JD etc. and etc. JDJDJDJDJDJDJDJD and etc.";
var searchStr = "etc";
int count = (strOrigin.Length - strOrigin.Replace(searchStr, "").Length)/searchStr.Length.

Проверяйте производительность перед тем, как отбросить это как неудобный/неуклюжий...

user3090281 11 нояб. 2014, в 14:20

2

string source = "/once/upon/a/time/";
int count = 0, n = 0;
while ((n = source.IndexOf('/', n) + 1) != 0) count++;

Вариант ответа Ричарда Уотсона, немного более быстрый с повышением эффективности, больше времени char происходит в строке и меньше кода!

Хотя я должен сказать, без тщательного тестирования каждого сценария, я видел очень значительное улучшение скорости, используя:

int count = 0;
for (int n = 0; n < source.Length; n++) if (source[n] == '/') count++;

user2011559 25 янв. 2013, в 17:58

2

Общая функция для вхождения строк:

public int getNumberOfOccurencies(String inputString, String checkString)
{
    if (checkString.Length > inputString.Length || checkString.Equals("")) { return 0; }
    int lengthDifference = inputString.Length - checkString.Length;
    int occurencies = 0;
    for (int i = 0; i < lengthDifference; i++) {
        if (inputString.Substring(i, checkString.Length).Equals(checkString)) { occurencies++; i += checkString.Length - 1; } }
    return occurencies;
}

Stefanos Kargas 10 март 2012, в 15:07

2

Это создает ОГРОМНОЕ количество временных строк и делает сборщик мусора очень тяжелым.
EricLaw 29 июнь 2015, в 16:42

1

В случае строкового разделителя (не для случая char, как говорит предмет):
string source = "@@@once @@@on @@@a @@@time @@@";
int count = source.Split(new [] { "@@@" }, StringSplitOptions.RemoveEmptyEntries).Length - 1;

Исходное исходное значение плаката ( "/once/on/a/time/" ) естественным разделителем является char '/', и ответы действительно объясняют параметр source.Split(char []), хотя...

Sam Saarian 17 нояб. 2017, в 20:55

1

Мой первоначальный взнос дал мне что-то вроде:

public static int CountOccurrences(string original, string substring)
{
    if (string.IsNullOrEmpty(substring))
        return 0;
    if (substring.Length == 1)
        return CountOccurrences(original, substring[0]);
    if (string.IsNullOrEmpty(original) ||
        substring.Length > original.Length)
        return 0;
    int substringCount = 0;
    for (int charIndex = 0; charIndex < original.Length; charIndex++)
    {
        for (int subCharIndex = 0, secondaryCharIndex = charIndex; subCharIndex < substring.Length && secondaryCharIndex < original.Length; subCharIndex++, secondaryCharIndex++)
        {
            if (substring[subCharIndex] != original[secondaryCharIndex])
                goto continueOuter;
        }
        if (charIndex + substring.Length > original.Length)
            break;
        charIndex += substring.Length - 1;
        substringCount++;
    continueOuter:
        ;
    }
    return substringCount;
}

public static int CountOccurrences(string original, char @char)
{
    if (string.IsNullOrEmpty(original))
        return 0;
    int substringCount = 0;
    for (int charIndex = 0; charIndex < original.Length; charIndex++)
        if (@char == original[charIndex])
            substringCount++;
    return substringCount;
}

Игла в подходе сена с использованием замены и деления дает 21 + секунд, тогда как это занимает около 15,2.

Отредактируйте после добавления бит, который добавит substring.Length - 1 в charIndex (как и должно быть), через 11.6 секунд.

Изменить 2: я использовал строку, в которой было 26 двухсимвольных строк, здесь приведены времена, обновленные до тех же самых текстов:

Игла в стоге сена (версия OP): 7.8 секунды

Предлагаемый механизм: 4.6 секунды.

Редактирование 3: добавление одиночного символьного углового фрейма, оно продолжалось до 1,2 секунды.

Изменить 4: Для контекста: использовалось 50 миллионов итераций.

Alexander Morou 29 май 2015, в 03:09

1

string search = "/string";
var occurrences = (regex.Match(search, @"\/")).Count;

Это будет отсчитываться каждый раз, когда программа находит "/s" точно (с учетом регистра) и число вхождений этого будет сохранено в переменной "вхождения"

Adam Higgins 07 май 2015, в 11:09

1

Думал, что я брошу свой метод расширения на ринг (см. комментарии для получения дополнительной информации). Я не делал никаких официальных проверок, но я думаю, что для большинства сценариев это должно быть очень быстро.

EDIT: ОК - поэтому этот вопрос помог мне понять, как производительность нашей текущей реализации будет складываться против некоторых из представленных здесь решений. Я решил сделать небольшую заметку и нашел, что наше решение в значительной степени соответствует производительности решения, предоставленного Ричардом Уотсоном, до тех пор, пока вы не начнете агрессивный поиск с большими строками (100 Kb +), большими подстроками (32 Kb + ) и много встроенных повторений (10K +). В этот момент наше решение было примерно в 2X-4 раза медленнее. Учитывая это и тот факт, что нам действительно нравится решение, представленное Ричардом Уотсоном, мы соответствующим образом реорганизовали наше решение. Я просто хотел сделать это доступным для всех, кто мог бы извлечь из этого выгоду.

Наше оригинальное решение:

    /// <summary>
    /// Counts the number of occurrences of the specified substring within
    /// the current string.
    /// </summary>
    /// <param name="s">The current string.</param>
    /// <param name="substring">The substring we are searching for.</param>
    /// <param name="aggressiveSearch">Indicates whether or not the algorithm 
    /// should be aggressive in its search behavior (see Remarks). Default 
    /// behavior is non-aggressive.</param>
    /// <remarks>This algorithm has two search modes - aggressive and 
    /// non-aggressive. When in aggressive search mode (aggressiveSearch = 
    /// true), the algorithm will try to match at every possible starting 
    /// character index within the string. When false, all subsequent 
    /// character indexes within a substring match will not be evaluated. 
    /// For example, if the string was 'abbbc' and we were searching for 
    /// the substring 'bb', then aggressive search would find 2 matches 
    /// with starting indexes of 1 and 2. Non aggressive search would find 
    /// just 1 match with starting index at 1. After the match was made, 
    /// the non aggressive search would attempt to make it next match 
    /// starting at index 3 instead of 2.</remarks>
    /// <returns>The count of occurrences of the substring within the string.</returns>
    public static int CountOccurrences(this string s, string substring, 
        bool aggressiveSearch = false)
    {
        // if s or substring is null or empty, substring cannot be found in s
        if (string.IsNullOrEmpty(s) || string.IsNullOrEmpty(substring))
            return 0;

        // if the length of substring is greater than the length of s,
        // substring cannot be found in s
        if (substring.Length > s.Length)
            return 0;

        var sChars = s.ToCharArray();
        var substringChars = substring.ToCharArray();
        var count = 0;
        var sCharsIndex = 0;

        // substring cannot start in s beyond following index
        var lastStartIndex = sChars.Length - substringChars.Length;

        while (sCharsIndex <= lastStartIndex)
        {
            if (sChars[sCharsIndex] == substringChars[0])
            {
                // potential match checking
                var match = true;
                var offset = 1;
                while (offset < substringChars.Length)
                {
                    if (sChars[sCharsIndex + offset] != substringChars[offset])
                    {
                        match = false;
                        break;
                    }
                    offset++;
                }
                if (match)
                {
                    count++;
                    // if aggressive, just advance to next char in s, otherwise, 
                    // skip past the match just found in s
                    sCharsIndex += aggressiveSearch ? 1 : substringChars.Length;
                }
                else
                {
                    // no match found, just move to next char in s
                    sCharsIndex++;
                }
            }
            else
            {
                // no match at current index, move along
                sCharsIndex++;
            }
        }

        return count;
    }

И вот наше исправленное решение:

    /// <summary>
    /// Counts the number of occurrences of the specified substring within
    /// the current string.
    /// </summary>
    /// <param name="s">The current string.</param>
    /// <param name="substring">The substring we are searching for.</param>
    /// <param name="aggressiveSearch">Indicates whether or not the algorithm 
    /// should be aggressive in its search behavior (see Remarks). Default 
    /// behavior is non-aggressive.</param>
    /// <remarks>This algorithm has two search modes - aggressive and 
    /// non-aggressive. When in aggressive search mode (aggressiveSearch = 
    /// true), the algorithm will try to match at every possible starting 
    /// character index within the string. When false, all subsequent 
    /// character indexes within a substring match will not be evaluated. 
    /// For example, if the string was 'abbbc' and we were searching for 
    /// the substring 'bb', then aggressive search would find 2 matches 
    /// with starting indexes of 1 and 2. Non aggressive search would find 
    /// just 1 match with starting index at 1. After the match was made, 
    /// the non aggressive search would attempt to make it next match 
    /// starting at index 3 instead of 2.</remarks>
    /// <returns>The count of occurrences of the substring within the string.</returns>
    public static int CountOccurrences(this string s, string substring, 
        bool aggressiveSearch = false)
    {
        // if s or substring is null or empty, substring cannot be found in s
        if (string.IsNullOrEmpty(s) || string.IsNullOrEmpty(substring))
            return 0;

        // if the length of substring is greater than the length of s,
        // substring cannot be found in s
        if (substring.Length > s.Length)
            return 0;

        int count = 0, n = 0;
        while ((n = s.IndexOf(substring, n, StringComparison.InvariantCulture)) != -1)
        {
            if (aggressiveSearch)
                n++;
            else
                n += substring.Length;
            count++;
        }

        return count;
    }

Casey Chester 24 март 2015, в 12:23

1

Если вы проверьте эту веб-страницу, 15 различных способов сделать это сравниваются, включая использование параллельных циклов.

Самый быстрый способ, по-видимому, заключается в использовании одного потока для цикла (если у вас есть .Net версия < 4.0) или цикл parallel.for(при использовании .Net > 4.0 с тысячами проверок).

Предполагая, что "ss" - это ваша строка поиска, "ch" - это ваш массив символов (если у вас есть более одного char, который вы ищете), здесь основной смысл кода, который имел самое быстрое время выполнения single резьбовое:

for (int x = 0; x < ss.Length; x++)
{
    for (int y = 0; y < ch.Length; y++)
    {
        for (int a = 0; a < ss[x].Length; a++ )
        {
        if (ss[x][a] == ch[y])
            //it found. DO what you need to here.
        }
    }
}

Исходный код теста также предоставляется, чтобы вы могли запускать собственные тесты.

Do What You Love 16 авг. 2014, в 14:50

1

string s = "HOWLYH THIS ACTUALLY WORKSH WOWH";
int count = 0;
for (int i = 0; i < s.Length; i++)
   if (s[i] == 'H') count++;

Он просто проверяет каждый символ в строке, если символ является символом, который вы ищете, добавьте его для подсчета.

joppiesaus 14 июнь 2014, в 18:45

1

            var conditionalStatement = conditionSetting.Value;

            //order of replace matters, remove == before =, incase of ===
            conditionalStatement = conditionalStatement.Replace("==", "~").Replace("!=", "~").Replace('=', '~').Replace('!', '~').Replace('>', '~').Replace('<', '~').Replace(">=", "~").Replace("<=", "~");

            var listOfValidConditions = new List<string>() { "!=", "==", ">", "<", ">=", "<=" };

            if (conditionalStatement.Count(x => x == '~') != 1)
            {
                result.InvalidFieldList.Add(new KeyFieldData(batch.DECurrentField, "The IsDoubleKeyCondition does not contain a supported conditional statement. Contact System Administrator."));
                result.Status = ValidatorStatus.Fail;
                return result;
            }

Нужно сделать что-то подобное тестовым условным операторам из строки.

Заменили то, что я искал с помощью одного символа, и подсчитал экземпляры одного символа.

Очевидно, что один символ, который вы используете, должен быть проверен, чтобы не существовать в строке, прежде чем это произойдет, чтобы избежать неправильного подсчета.

bizah 29 март 2013, в 20:13

1

string Name = "Very good nice one is very good but is very good nice one this is called the term";
bool valid=true;
int count = 0;
int k=0;
int m = 0;
while (valid)
{
    k = Name.Substring(m,Name.Length-m).IndexOf("good");
    if (k != -1)
    {
        count++;
        m = m + k + 4;
    }
    else
        valid = false;
}
Console.WriteLine(count + " Times accures");

Prashanth 04 апр. 2012, в 07:48

0

Пожалуйста, прокомментируйте свой код.
Johnny Graber 27 окт. 2012, в 07:23

1

str="aaabbbbjjja";
int count = 0;
int size = str.Length;

string[] strarray = new string[size];
for (int i = 0; i < str.Length; i++)
{
    strarray[i] = str.Substring(i, 1);
}
Array.Sort(strarray);
str = "";
for (int i = 0; i < strarray.Length - 1; i++)
{

    if (strarray[i] == strarray[i + 1])
    {

        count++;
    }
    else
    {
        count++;
        str = str + strarray[i] + count;
        count = 0;
    }

}
count++;
str = str + strarray[strarray.Length - 1] + count;

Это для подсчета появления символа. Для этого примера вывод будет "a4b4j3"

Narendra Kumar 09 дек. 2011, в 13:26

2

Не совсем «подсчет вхождений строки», более подсчет символов - как насчет способа указать, какой строке соответствовать Narenda?
Paul Sullivan 09 дек. 2011, в 13:51
1

int count = 0; string str = "у нас есть foo и foo, пожалуйста, подсчитайте foo в этом"; string stroccurance = "foo"; string [] strarray = str.Split (''); Array.sort (strarray); str = ""; for (int i = 0; i <strarray.Length - 1; i ++) {if (strarray [i] == stroccurance) {count ++; }} str = "Количество случаев для" + stroccurance + "is" + count; Посредством этого вы можете сосчитать любое вхождение строки в этом примере. Я подсчитываю вхождение "foo", и оно даст мне вывод 3.
Narendra Kumar 15 дек. 2011, в 07:10

0

Я чувствовал, что нам не хватало определенных видов подсчета подстрок, таких как небезопасные побайтовые сравнения. Я собрал оригинальный метод постера и любые методы, которые могли придумать.

Это расширения строк, которые я сделал.

namespace Example
{
    using System;
    using System.Text;

    public static class StringExtensions
    {
        public static int CountSubstr(this string str, string substr)
        {
            return (str.Length - str.Replace(substr, "").Length) / substr.Length;
        }

        public static int CountSubstr(this string str, char substr)
        {
            return (str.Length - str.Replace(substr.ToString(), "").Length);
        }

        public static int CountSubstr2(this string str, string substr)
        {
            int substrlen = substr.Length;
            int lastIndex = str.IndexOf(substr, 0, StringComparison.Ordinal);
            int count = 0;
            while (lastIndex != -1)
            {
                ++count;
                lastIndex = str.IndexOf(substr, lastIndex + substrlen, StringComparison.Ordinal);
            }

            return count;
        }

        public static int CountSubstr2(this string str, char substr)
        {
            int lastIndex = str.IndexOf(substr, 0);
            int count = 0;
            while (lastIndex != -1)
            {
                ++count;
                lastIndex = str.IndexOf(substr, lastIndex + 1);
            }

            return count;
        }

        public static int CountChar(this string str, char substr)
        {
            int length = str.Length;
            int count = 0;
            for (int i = 0; i < length; ++i)
                if (str[i] == substr)
                    ++count;

            return count;
        }

        public static int CountChar2(this string str, char substr)
        {
            int count = 0;
            foreach (var c in str)
                if (c == substr)
                    ++count;

            return count;
        }

        public static unsafe int CountChar3(this string str, char substr)
        {
            int length = str.Length;
            int count = 0;
            fixed (char* chars = str)
            {
                for (int i = 0; i < length; ++i)
                    if (*(chars + i) == substr)
                        ++count;
            }

            return count;
        }

        public static unsafe int CountChar4(this string str, char substr)
        {
            int length = str.Length;
            int count = 0;
            fixed (char* chars = str)
            {
                for (int i = length - 1; i >= 0; --i)
                    if (*(chars + i) == substr)
                        ++count;
            }

            return count;
        }

        public static unsafe int CountSubstr3(this string str, string substr)
        {
            int length = str.Length;
            int substrlen = substr.Length;
            int count = 0;
            fixed (char* strc = str)
            {
                fixed (char* substrc = substr)
                {
                    int n = 0;

                    for (int i = 0; i < length; ++i)
                    {
                        if (*(strc + i) == *(substrc + n))
                        {
                            ++n;
                            if (n == substrlen)
                            {
                                ++count;
                                n = 0;
                            }
                        }
                        else
                            n = 0;
                    }
                }
            }

            return count;
        }

        public static int CountSubstr3(this string str, char substr)
        {
            return CountSubstr3(str, substr.ToString());
        }

        public static unsafe int CountSubstr4(this string str, string substr)
        {
            int length = str.Length;
            int substrLastIndex = substr.Length - 1;
            int count = 0;
            fixed (char* strc = str)
            {
                fixed (char* substrc = substr)
                {
                    int n = substrLastIndex;

                    for (int i = length - 1; i >= 0; --i)
                    {
                        if (*(strc + i) == *(substrc + n))
                        {
                            if (--n == -1)
                            {
                                ++count;
                                n = substrLastIndex;
                            }
                        }
                        else
                            n = substrLastIndex;
                    }
                }
            }

            return count;
        }

        public static int CountSubstr4(this string str, char substr)
        {
            return CountSubstr4(str, substr.ToString());
        }
    }
}

Вслед за тестовым кодом...

static void Main()
{
    const char matchA = '_';
    const string matchB = "and";
    const string matchC = "muchlongerword";
    const string testStrA = "_and_d_e_banna_i_o___pfasd__and_d_e_banna_i_o___pfasd_";
    const string testStrB = "and sdf and ans andeians andano ip and and sdf and ans andeians andano ip and";
    const string testStrC =
        "muchlongerword amuchlongerworsdfmuchlongerwordsdf jmuchlongerworijv muchlongerword sdmuchlongerword dsmuchlongerword";
    const int testSize = 1000000;
    Console.WriteLine(testStrA.CountSubstr('_'));
    Console.WriteLine(testStrA.CountSubstr2('_'));
    Console.WriteLine(testStrA.CountSubstr3('_'));
    Console.WriteLine(testStrA.CountSubstr4('_'));
    Console.WriteLine(testStrA.CountChar('_'));
    Console.WriteLine(testStrA.CountChar2('_'));
    Console.WriteLine(testStrA.CountChar3('_'));
    Console.WriteLine(testStrA.CountChar4('_'));
    Console.WriteLine(testStrB.CountSubstr("and"));
    Console.WriteLine(testStrB.CountSubstr2("and"));
    Console.WriteLine(testStrB.CountSubstr3("and"));
    Console.WriteLine(testStrB.CountSubstr4("and"));
    Console.WriteLine(testStrC.CountSubstr("muchlongerword"));
    Console.WriteLine(testStrC.CountSubstr2("muchlongerword"));
    Console.WriteLine(testStrC.CountSubstr3("muchlongerword"));
    Console.WriteLine(testStrC.CountSubstr4("muchlongerword"));
    var timer = new Stopwatch();
    timer.Start();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountSubstr(matchA);
    timer.Stop();
    Console.WriteLine("CS1 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrB.CountSubstr(matchB);
    timer.Stop();
    Console.WriteLine("CS1 and: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrC.CountSubstr(matchC);
    timer.Stop();
    Console.WriteLine("CS1 mlw: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountSubstr2(matchA);
    timer.Stop();
    Console.WriteLine("CS2 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrB.CountSubstr2(matchB);
    timer.Stop();
    Console.WriteLine("CS2 and: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrC.CountSubstr2(matchC);
    timer.Stop();
    Console.WriteLine("CS2 mlw: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountSubstr3(matchA);
    timer.Stop();
    Console.WriteLine("CS3 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrB.CountSubstr3(matchB);
    timer.Stop();
    Console.WriteLine("CS3 and: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrC.CountSubstr3(matchC);
    timer.Stop();
    Console.WriteLine("CS3 mlw: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountSubstr4(matchA);
    timer.Stop();
    Console.WriteLine("CS4 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrB.CountSubstr4(matchB);
    timer.Stop();
    Console.WriteLine("CS4 and: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrC.CountSubstr4(matchC);
    timer.Stop();
    Console.WriteLine("CS4 mlw: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountChar(matchA);
    timer.Stop();
    Console.WriteLine("CC1 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountChar2(matchA);
    timer.Stop();
    Console.WriteLine("CC2 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountChar3(matchA);
    timer.Stop();
    Console.WriteLine("CC3 chr: " + timer.Elapsed.TotalMilliseconds + "ms");

    timer.Restart();
    for (int i = 0; i < testSize; ++i)
        testStrA.CountChar4(matchA);
    timer.Stop();
    Console.WriteLine("CC4 chr: " + timer.Elapsed.TotalMilliseconds + "ms");
}

Результаты: CSX соответствует CountSubstrX, а CCX соответствует CountCharX. "chr" ищет строку для "_", "и" ищет строку для "and", а "mlw" ищет строку для "muchlongerword"

CS1 chr: 824.123ms
CS1 and: 586.1893ms
CS1 mlw: 486.5414ms
CS2 chr: 127.8941ms
CS2 and: 806.3918ms
CS2 mlw: 497.318ms
CS3 chr: 201.8896ms
CS3 and: 124.0675ms
CS3 mlw: 212.8341ms
CS4 chr: 81.5183ms
CS4 and: 92.0615ms
CS4 mlw: 116.2197ms
CC1 chr: 66.4078ms
CC2 chr: 64.0161ms
CC3 chr: 65.9013ms
CC4 chr: 65.8206ms

И, наконец, у меня был файл с 3,6 миллионами символов. Это был "derp adfderdserp dfaerpderp deasderp", повторенный 100 000 раз. Я искал "derp" внутри файла с помощью описанных выше методов 100 раз эти результаты.

CS1Derp: 1501.3444ms
CS2Derp: 1585.797ms
CS3Derp: 376.0937ms
CS4Derp: 271.1663ms

Так что мой 4-й метод определенно является победителем, но на самом деле, если файл с 3,6 миллионами символов 100 раз потребовал всего 1586мс как худший случай, то все это довольно незначительно.

Кстати, я также отсканировал символ 'd' в 3,6-миллионном символьном файле со 100-кратными методами CountSubstr и CountChar. Результаты...

CS1  d : 2606.9513ms
CS2  d : 339.7942ms
CS3  d : 960.281ms
CS4  d : 233.3442ms
CC1  d : 302.4122ms
CC2  d : 280.7719ms
CC3  d : 299.1125ms
CC4  d : 292.9365ms

Исходя из этого, оригинальный метод постеров очень плох для односимвольных игл в большом стоге сена.

Примечание. Все значения были обновлены до версии выпуска. Я случайно забыл использовать режим Release при первой публикации этого сообщения. Некоторые из моих заявлений были изменены.

Nicholas R. Grant 07 дек. 2018, в 11:06

Ещё вопросы

+1: я должен сказать, что это совсем другой способ считать. я удивлен результатами тестов :)
Это не так уж и отличается ... это типичный способ реализации этой функциональности в SQL: LEN(ColumnToCheck) - LEN(REPLACE(ColumnToCheck,"N","")) .
На самом деле вы должны разделить на "/".Length
Могу я спросить, что, по вашим требованиям, должно быть подсчитано для числа вхождений "//" в "/////"? 2 или 4?
использование регулярных выражений, вероятно, лучший способ сделать это
что вы имеете в виду "выкопать RegEx", я думаю, что вы имели бы в виду то же самое в отношении Linq, поскольку это может быть более неясным и не может быть меньше накладных расходов, если таковые имеются?
Вы могли бы получить незначительное улучшение, переключившись на for вместо foreach, но только чуть-чуть.
Нет. Вопрос состоит в том, чтобы посчитать вхождение строки, а не символа.
@ Отметьте, что это должно быть быстрее - foreach создает объект перечислителя и вызывает некоторые методы для каждой итерации. И мы говорим только о крошечных, крошечных кусочках улучшения в любом случае
Это подсчет символов в строке. Название о подсчете строк в строке
@Mark Только что проверил это с помощью цикла for, и это было на самом деле медленнее, чем при использовании foreach. Может быть из-за проверки границ? (Время составило 1,65 с против 2,05 на 5-миллионных итерациях.)
В то время как вопрос заключается в запросе строки внутри строки, пример задачи, опубликованной OP, на самом деле является всего лишь одним символом, и в этом случае я бы назвал этот ответ все еще допустимым решением, так как он показывает лучший способ (поиск по символу вместо поиска по строке) решить проблему под рукой.
+1 - В некоторых случаях вы можете добавить RegexOptions.IgnoreCase .
Накладные расходы в Regex не идеальны, плюс "я действительно не хочу копать RegEx для этого, не так ли?"
может не захотеть Regex.Escape(...) поэтому new System.Text.RegularExpressions.Regex(needle).Matches(haystack).Count;
Не уверен, как я могу объяснить это более четко, чем приведенное описание. Что смущает?
СУПЕР МЕДЛЕННО! Попробовал его на странице HTML, и это заняло около 2 минут, в отличие от других методов на этой странице, которые заняли 2 секунды. Ответ был правильным; он был слишком медленным, чтобы его можно было использовать.
согласился, слишком медленно Я большой поклонник решений в стиле linq, но это просто нежизнеспособно.
Обратите внимание, что причина, по которой это происходит так медленно, состоит в том, что он создает n строк, таким образом выделяя примерно n ^ 2/2 байта.
Очень медленно, но отвечает на заголовок вопроса (хотя тело вопроса отличается)
OutOfMemoryException выбрасывается для моих 210000 символов строки.
это, кажется, самый медленный, НО единственный, который соответствует моим потребностям! например, поиск строки "lol" в "lolololololol" должен привести к 6 случаям, тогда как все остальные методы здесь возвращают 3., поскольку они считаются как " lol o lol o lol ol"
src.Where((c, i) => src.Skip(i).Take(target.Length).SequenceEqual(target)).Count() меньше памяти и работает быстрее :)
Я собирался добавить свое собственное «низкоуровневое» решение (без создания подстрок, использования replace / split или какого-либо Regex / Linq), но ваше, возможно, даже лучше, чем мое (и, по крайней мере, короче). Спасибо!
Для решений Regex добавьте Regex.Escape(needle)
Просто чтобы указать на других, нужно искать значение поиска, если оно пустое, иначе вы попадете в бесконечный цикл.
Может быть, это только я, но для source="aaa" substring="aa" я ожидал получить обратно 2, а не 1. Чтобы "исправить" это, измените n += substring.Length на n++
Вы можете добавить флаг overlapped для соответствия вашему случаю, например так: overlapped=True;.... if(overlapped) {++n;} else {n += substring.Length;}
Стоит ли там использовать var? Есть ли шанс, что Count будет заменен чем-то, что не возвращает int?
@Whatsit: вы можете печатать «var» только левой рукой, а «int» - обеими руками;)
Что ж, вы можете предпочесть int там. Я часто буду использовать var для локальных, даже если тип переменной очевиден. Личное предпочтение.
все буквы int находятся в ключах home, а var - нет. эээ .. подожди, я использую Дворжак
Я не могу заставить его скомпилировать :( Не понимает ли Count на строках
@BDotA Убедитесь, что у вас есть «using System.Linq;» в верхней части вашего файла. Кроме того, intellisense может скрыть от вас вызов .Count, поскольку это строка. Несмотря на это, он будет компилироваться и работать просто отлично.
@JudahGabrielHimango Я бы сказал, что var следует использовать, особенно когда тип переменной очевиден (и для краткости и согласованности)
Вы можете поместить source.IndexOf('/', n + 1) и потерять n++ и скобки while :) Также вместо символа поместите переменную string word = "/" .
Эй, Нико, зацени новые ответы. Хотя сделать подстроку переменной длины будет сложнее.
Я использовал нечто подобное, шагая по подстроке; пока я не понял, что у indexOf есть startIndex. Мне больше всего нравится первое решение, так как это хороший баланс между скоростью и объемом памяти.
Я где-то читал, что быстрее итерировать в обратном направлении, потому что быстрее сравнивать значение с 0
@RichardWatson Является ли ToCharArray дешевой операцией?
@shitpoet да. Если вы посмотрите на базовый код, это нативный вызов. public char [] toCharArray () {... System.arraycopy (значение, 0, результат, 0, значение.длина); ...}
Для учета многосимвольных замен. Без него подсчет «в» тесте является ключом »вернул бы 6.
Сравнительный анализ и сравнение со строкой. Сплит-способ - работает примерно в 1,5 раза быстрее. Престижность.
Вот что я делаю. И source.Split(new[]{"//"}, StringSplitOptions.None).Count - 1 для source.Split(new[]{"//"}, StringSplitOptions.None).Count - 1 разделителей.
Это будет выполнять как минимум n выделений строк в куче, плюс (возможно) несколько переопределений массива - и все это только для подсчета? Чрезвычайно неэффективен, плохо масштабируется и никогда не должен использоваться в каком-либо важном коде.
Это неверно, если входные данные содержат специальные символы regex ie | Там должен быть Regex.Escape (вход)
Хорошее решение - и работает для строки тоже (не только символ)!
Спасибо, слишком легко забыть некоторые тонкости обработки строк при смене языков - как это делают большинство из нас в наши дни!
-1 потому что: знаете ли вы разницу между Count () и Count или Length? Если кто-то использует Count () вместо Count или Length, я получаю срабатывание. Count () создает IEnumerator, затем проходит через все вхождения IEnumerable, тогда как Count или Length уже задают свойства объекта, которые уже содержат желаемое количество, без необходимости перебирать все элементы.
Хорошее место, и что странно, что в моей библиотеке, откуда я взял функцию, я использую «Длина». Под редакцией!
Только не передавайте пустую строку для переменной «слово» (ошибка деления на ноль).
Это создает ОГРОМНОЕ количество временных строк и делает сборщик мусора очень тяжелым.
Пожалуйста, прокомментируйте свой код.
Не совсем «подсчет вхождений строки», более подсчет символов - как насчет способа указать, какой строке соответствовать Narenda?
int count = 0; string str = "у нас есть foo и foo, пожалуйста, подсчитайте foo в этом"; string stroccurance = "foo"; string [] strarray = str.Split (''); Array.sort (strarray); str = ""; for (int i = 0; i <strarray.Length - 1; i ++) {if (strarray [i] == stroccurance) {count ++; }} str = "Количество случаев для" + stroccurance + "is" + count; Посредством этого вы можете сосчитать любое вхождение строки в этом примере. Я подсчитываю вхождение "foo", и оно даст мне вывод 3.

LukeH · Accepted Answer · 2009-02-12T16-27-00.000Z

875

Лучший ответ

Если вы используете .NET 3.5, вы можете сделать это в одном слое с LINQ:

int count = source.Count(f => f == '/');

Если вы не хотите использовать LINQ, вы можете сделать это с помощью

int count = source.Split('/').Length - 1;

Вы можете быть удивлены, узнав, что ваша оригинальная техника, кажется, примерно на 30% быстрее, чем любой из этих! Я только что сделал быстрый тест с "/once/on/a/time/", и результаты следующие:

Ваш оригинал = 12s
source.Count = 19s
source.Split = 17s
foreach (из ответа bobwienholt) = 10 с

(Время для 50 000 000 итераций, поэтому вы вряд ли заметите большую разницу в реальном мире.)

LukeH 12 фев. 2009, в 16:27

1

Знаете ли вы, что вы можете вызывать Count (предикат) для строки без необходимости преобразовывать ее в массив символов? Смотрите мой ответ выше.
Judah Gabriel Himango 12 фев. 2009, в 16:04
0

@Judah, вы правы, но странно VS2008 не дает мне intellisense для источника. Счет - он компилируется и работает нормально, так что +1 за ваш ответ.
LukeH 12 фев. 2009, в 16:10
21

очень удивился, услышав, что мой код оказался быстрее всего!
inspite 12 фев. 2009, в 17:18
1

@ in.spite, Ваш оригинальный код также имеет то преимущество, что с небольшой настройкой (как в ответе ZombieSheep) вы можете искать строки произвольной длины, а не только один символ.
LukeH 12 фев. 2009, в 17:36
6

Да, VS скрывает методы расширения LINQ для строкового класса. Я думаю, они решили, что разработчики не захотят, чтобы все эти методы расширения отображались в строковом классе. Наверное, мудрое решение.
Judah Gabriel Himango 15 фев. 2009, в 23:27
0

Строка реализует IEnumerable <char>. Не уверен, сколько людей понимают это. Это странно в IntelliSense. VS2008 не показывает это, но VS2010 показывает.
Bryan 17 июнь 2011, в 16:11
9

Такое поведение возможно, потому что VS2010 автоматически включает System.Linq в новые файлы классов, VS2008, вероятно, этого не делает. Пространство имен должно быть внутри, чтобы intellisense работал.
Sprague 12 июль 2012, в 08:13
26

Обратите внимание, что решения Count и Split будут работать только при подсчете символов. Они не будут работать со строками, как решение OP.
Peter Lillevold 07 май 2014, в 09:03
2

Также стоит отметить, что если вы отслеживаете использование памяти с помощью System.GC.GetTotalMemory (false). Повторяя 50-миллионный итерационный тест, я вижу около 2 000 000 байтов, готовых к сборке мусора после LINQ. С циклом foreach ... ноль. LINQ может показаться изящным, но идти в старую школу, если вы находитесь в областях с большим повторением кода.
user922020 27 март 2015, в 21:22
1

@PeterLillevold На самом деле существует перегрузка Split, которая принимает строки: int count = source.Split (new string [] {"asdf"}, StringSplitOptions.None) .Length - 1;
heringer 13 нояб. 2015, в 16:21
0

Как насчет без учета регистра? Как мне заархивировать это?
YukiSakura 07 дек. 2015, в 09:45
5

f == '\' - это символы в строке, а не строки в строке
Thomas Weller 26 авг. 2016, в 14:13
9

Это похоже на ответ на другой вопрос: «Как бы вы посчитали появления символа в строке?»
Ben Aaronson 28 нояб. 2016, в 13:34

Показать ещё 11 комментариев