Как удалить недопустимые символы из пути и имен файлов?

Question

Как удалить недопустимые символы из пути и имен файлов?

352

Мне нужен надежный и простой способ удаления незаконных путей и файлов из простой строки. Я использовал приведенный ниже код, но он ничего не делает, что мне не хватает?

using System;
using System.IO;

namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            string illegal = "\"M<>\"\\a/ry/ h**ad:>> a\\/:*?\"<>| li*tt|le|| la\"mb.?";

            illegal = illegal.Trim(Path.GetInvalidFileNameChars());
            illegal = illegal.Trim(Path.GetInvalidPathChars());

            Console.WriteLine(illegal);
            Console.ReadLine();
        }
    }
}

Gary Willoughby 28 сен. 2008, в 15:49

Источник

0

Trim удаляет символы из начала и конца строк. Тем не менее, вы, вероятно, должны спросить, почему данные являются недействительными, и вместо того, чтобы пытаться санировать / исправить данные, отклонить данные.
user7116 28 сен. 2008, в 15:54
8

Имена стилей Unix недопустимы в Windows, и я не хочу иметь дело с 8.3 короткими именами.
Gary Willoughby 16 окт. 2009, в 12:04
0

GetInvalidFileNameChars() такие вещи, как: \ etc, из путей к папкам.
CAD bloke 20 май 2016, в 03:18
1

Path.GetInvalidPathChars() не похоже * или ?
CAD bloke 20 май 2016, в 03:24
13

Я проверил пять ответов на этот вопрос (временной цикл 100 000), и следующий метод самый быстрый. Регулярное выражение заняло 2-е место и было на 25% медленнее: открытая строка GetSafeFilename (string filename) {return string.Join ("_", filename.Split (Path.GetInvalidFileNameChars ())); }
Brain2000 15 июль 2016, в 15:20

Показать ещё 3 комментария

Теги:

c#

26 ответов

222

public string GetSafeFilename(string filename)
{

    return string.Join("_", filename.Split(Path.GetInvalidFileNameChars()));

}

Этот ответ был в другом потоке от Ceres, мне очень нравится это просто и просто.

Shehab Fawzy 20 апр. 2014, в 13:44

8

Чтобы точно ответить на вопрос ОП, вам нужно будет использовать «» вместо «_», но ваш ответ, вероятно, относится к большинству из нас на практике. Я думаю, что замена нелегальных символов некоторыми легальными делается чаще.
B H 08 янв. 2016, в 20:27
4

Это фантастический ответ. Я не знаю о производительности, но это очень легко читать и понимать.
PRMan 04 июль 2016, в 02:27
24

Я проверил пять методов из этого вопроса (временной цикл 100 000), и этот метод самый быстрый. Регулярное выражение заняло 2-е место и было на 25% медленнее, чем этот метод.
Brain2000 15 июль 2016, в 15:19
3

Это гений!
Dan Bechard 19 янв. 2017, в 20:05
3

Фантастическая идея! Это должен быть принятый ответ.
Owen 22 фев. 2017, в 21:30
8

Чтобы обратиться к комментарию @BH, можно просто использовать string.Concat (name.Split (Path.GetInvalidFileNameChars ()))
Michael Sutton 07 июнь 2017, в 14:06
0

Отличный ответ :) спасибо
Soheyl 13 янв. 2019, в 15:11

Показать ещё 5 комментариев

191

Я использую Linq для очистки имен файлов. Вы можете легко расширить это, чтобы проверить допустимые пути.

private static string CleanFileName(string fileName)
{
    return Path.GetInvalidFileNameChars().Aggregate(fileName, (current, c) => current.Replace(c.ToString(), string.Empty));
}

Update

Некоторые комментарии указывают, что этот метод не работает для них, поэтому я включил ссылку на фрагмент DotNetFiddle, чтобы вы могли проверить метод.

https://dotnetfiddle.net/nw1SWY

Michael Minton 12 сен. 2011, в 20:47

4

Это не сработало для меня. Метод не возвращает чистую строку. Он возвращает переданное имя файла как есть.
Karan 17 июль 2013, в 06:29
0

Что @Karan сказал, это не работает, оригинальная строка возвращается.
Jon 20 март 2014, в 15:26
0

На самом деле вы можете сделать это с помощью Linq следующим образом: var invalid = new HashSet<char>(Path.GetInvalidPathChars()); return new string(originalString.Where(s => !invalid.Contains(s)).ToArray()) . Производительность, вероятно, не велика, но это, вероятно, не имеет значения.
Casey 09 июль 2015, в 14:12
2

@ Каран или Джон Какой вклад вы посылаете этой функции? Смотрите мой редактор для проверки этого метода.
Michael Minton 24 сен. 2015, в 02:45
2

Это просто - парни передавали строки с действительными символами. Проголосовал за прохладный агрегатный раствор.
Nickmaovich 20 янв. 2016, в 13:10
0

Легко внедрить и поддерживать. Я преобразовал это в расширение строки в локальном пакете, чтобы использовать его во всех проектах «из коробки»
Gecko IT 08 сен. 2016, в 08:35
0

Очень хорошее решение, но очищает только имя файла (как указано), но не фактический путь, так как он рассматривает "\" как недопустимый символ и если у вас есть что-то вроде "\\ MyServer \ e $ \ demo \ Output \ Test \ 1111_joe_soap. pdf ", он возвращает" MyServere $ demoOutputTest1111_joe_soap.pdf "
Thierry 16 март 2017, в 10:45

Показать ещё 5 комментариев

79

Вы можете удалить незаконные символы, используя Linq, как это:

var invalidChars = Path.GetInvalidFileNameChars();

var invalidCharsRemoved = stringWithInvalidChars
.Where(x => !invalidChars.Contains(x))
.ToArray();

ИЗМЕНИТЬ
Вот как это выглядит с требуемым правлением, упомянутым в комментариях:

var invalidChars = Path.GetInvalidFileNameChars();

string invalidCharsRemoved = new string(stringWithInvalidChars
  .Where(x => !invalidChars.Contains(x))
  .ToArray());

Gregor Slavec 24 нояб. 2010, в 20:09

1

Мне нравится этот способ: вы сохраняете в строке только разрешенные символы (которые есть не что иное, как массив символов).
Dude Pascalou 04 июль 2012, в 09:36
5

Я знаю, что это старый вопрос, но это потрясающий ответ. Тем не менее, я хотел добавить, что в c # вы не можете приводить из char [] к строковым значениям либо неявно, либо явно (без ума, я знаю), поэтому вам нужно поместить его в строковый конструктор.
JNYRanger 21 окт. 2014, в 18:52
1

Я не подтвердил это, но я ожидаю, что Path.GetInvalidPathChars () будет надмножеством GetInvalidFileNameChars () и будет охватывать как имена файлов, так и пути, поэтому я, вероятно, использовал бы это вместо этого.
angularsen 09 янв. 2015, в 22:11
2

Это должно быть ответом вместо тех ужасно выглядящих записей Regex! ;)
Jeb 03 сен. 2015, в 16:22
2

@anjdreas на самом деле Path.GetInvalidPathChars () представляется подмножеством Path.GetInvalidFileNameChars (), а не наоборот. Например, Path.GetInvalidPathChars () не будет возвращать «?».
Rafael Costa 30 дек. 2015, в 10:21
1

Это хороший ответ. Я использую как список имен файлов, так и список путей к файлам: ____________________________ строка cleanData = новая строка (data.Where (x =>! Path.GetInvalidFileNameChars (). Contains (x) &&! Path.GetInvalidPathChars (). Contains (x)). ToArray ());
goamn 30 нояб. 2017, в 05:28

Показать ещё 4 комментария

27

Все это отличные решения, но все они полагаются на Path.GetInvalidFileNameChars, которые могут быть не такими надежными, как вы думаете. Обратите внимание на следующее примечание в документации MSDN на Path.GetInvalidFileNameChars:

Массив, возвращаемый с помощью этого метода, не гарантированно содержит полный набор символов, которые недействительны в именах файлов и каталогов. Полный набор недопустимых символов может отличаться в зависимости от файловой системы. Например, на платформах для настольных компьютеров Windows недопустимые символы пути могут включать символы ASCII/Unicode с 1 по 31, а также цитату ("), меньше (<), больше ( > ), pipe (|), backspace (\ b), null (\ 0) и tab (\ t).

Это не лучше с Path.GetInvalidPathChars. Он содержит то же самое замечание.

René 16 нояб. 2011, в 15:14

12

Тогда в чем смысл Path.GetInvalidFileNameChars? Я ожидаю, что он вернет точно недопустимые символы для текущей системы, полагаясь на .NET, чтобы узнать, на какой файловой системе я работаю, и предоставив мне подходящие неверные символы. Если это не так, и он просто возвращает жестко закодированные символы, которые, во-первых, ненадежны, этот метод следует удалить, поскольку он имеет нулевое значение.
Jan 18 янв. 2014, в 18:08
1

Я знаю, что это старый комментарий, но @Jan вы можете написать в другой файловой системе, может быть, поэтому есть предупреждение.
fantastik78 07 июль 2015, в 13:59
3

@ fantastik78 хороший момент, но в этом случае я хотел бы иметь дополнительный аргумент enum для указания моей удаленной FS. Если это слишком много усилий по обслуживанию (что наиболее вероятно), весь этот метод все еще плохая идея, потому что он дает неправильное представление о безопасности.
Jan 03 сен. 2015, в 10:33
1

@ Ян, я полностью согласен с тобой, я просто спорил о предупреждении.
fantastik78 03 сен. 2015, в 14:39
0

Интересно, что это своего рода «черный список» недопустимых символов. Не лучше ли «внести в белый список» только известные действительные символы здесь ?! Напоминает мне глупую идею "virusscanner" вместо разрешенных приложений из белого списка ....
Bernhard 10 июль 2018, в 08:48
0

обратите внимание на то, что имена файлов указаны в предупреждении. Это на самом деле говорит вам, что это не проверка самих имен файлов, а только недопустимые символы. Вы все еще можете иметь недопустимое имя файла, которое является зарезервированным словом. Кроме того, как бы вы добавили приложение в белый список? Я бы просто сделал так, чтобы у моего вируса было ваше имя и подпись.
John Lord 29 нояб. 2018, в 17:04

Показать ещё 4 комментария

18

Для начала Trim только удаляет символы с начала или конца строки. Во-вторых, вы должны оценить, действительно ли хотите удалить оскорбительные символы или быстро выйти из строя и сообщить пользователю, что их имя недействительно. Мой выбор - последний, но мой ответ должен хотя бы показать вам, как правильно поступать правильно и неправильно:

https://stackoverflow.com/questions/62771/how-do-i-check-if-a-given-string-is-a-legal-valid-file-name-under-windows. Обратите внимание, что вы можете использовать регулярное выражение из этого вопроса для удаления символов с заменой регулярного выражения (если вам действительно нужно это сделать).

user7116 28 сен. 2008, в 16:54

0

Я особенно согласен со вторым советом.
OregonGhost 28 сен. 2008, в 15:59
3

Обычно я соглашусь со вторым, но у меня есть программа, которая генерирует имя файла и в некоторых ситуациях может содержать недопустимые символы. Поскольку моя программа генерирует недопустимые имена файлов, я думаю, что целесообразно удалить / заменить эти символы. (Просто указывает на действительный вариант использования)
JDB 09 май 2013, в 15:48

16

Для имен файлов:

string cleanFileName = String.Join("", fileName.Split(Path.GetInvalidFileNameChars()));

Для полных путей:

string cleanPath = String.Join("", path.Split(Path.GetInvalidPathChars()));

Lily Finley 11 фев. 2014, в 02:46

0

Очень хитрое и интеллектуальное решение! Палец вверх
Bernhard 27 фев. 2018, в 13:59

15

Я использую регулярные выражения для достижения этого. Во-первых, я динамически создаю регулярное выражение.

string regex = string.Format(
                   "[{0}]",
                   Regex.Escape(new string(Path.GetInvalidFileNameChars())));
Regex removeInvalidChars = new Regex(regex, RegexOptions.Singleline | RegexOptions.Compiled | RegexOptions.CultureInvariant);

Затем я просто вызываю removeInvalidChars.Replace, чтобы найти и заменить. Это, очевидно, может быть расширено, чтобы покрывать также символы пути.

Jeff Yates 28 сен. 2008, в 19:15

0

Этот код не работает по какой-то причине.
Bryan Legend 06 фев. 2010, в 21:52
0

Странно, это работает на меня. Я проверю это дважды, когда получу шанс. Можете ли вы быть более конкретным и объяснить, что именно не работает для вас?
Jeff Yates 08 фев. 2010, в 15:56
1

Это не сработает (по крайней мере, правильно), потому что вы не экранируете символы пути правильно, а некоторые из них имеют особое значение. Обратитесь к моему ответу, как это сделать.
Matthew Scharley 08 апр. 2010, в 21:39
0

@Jeff: Твоя версия все еще лучше, чем у Мэтью, если ты немного изменишь ее. Обратитесь к моему ответу о том, как.
Jan 13 фев. 2012, в 08:28
1

Я также добавил бы некоторые другие недопустимые шаблоны имен файлов, которые можно найти в MSDN, и расширил бы ваше решение до следующего регулярного выражения: new Regex(String.Format("^(CON|PRN|AUX|NUL|CLOCK\$|COM[1-9]|LPT[1-9])(?=\..|$)|(^(\.+|\s+)$)|((\.+|\s+)$)|([{0}])", Regex.Escape(new String(Path.GetInvalidFileNameChars()))), RegexOptions.Compiled | RegexOptions.Singleline | RegexOptions.CultureInvariant); регулярное выражение new Regex(String.Format("^(CON|PRN|AUX|NUL|CLOCK\$|COM[1-9]|LPT[1-9])(?=\..|$)|(^(\.+|\s+)$)|((\.+|\s+)$)|([{0}])", Regex.Escape(new String(Path.GetInvalidFileNameChars()))), RegexOptions.Compiled | RegexOptions.Singleline | RegexOptions.CultureInvariant);
yar_shukan 10 сен. 2014, в 14:46

Показать ещё 3 комментария

14

Я абсолютно предпочитаю идею Джеффа Йетса. Он будет работать отлично, если вы слегка измените его:

string regex = String.Format("[{0}]", Regex.Escape(new string(Path.GetInvalidFileNameChars())));
Regex removeInvalidChars = new Regex(regex, RegexOptions.Singleline | RegexOptions.Compiled | RegexOptions.CultureInvariant);

Улучшение заключается лишь в том, чтобы избежать автоматического создания регулярного выражения.

Jan 15 фев. 2011, в 15:05

0

Но твой код такой же, как у Джеффса ?!
Christoph Staudinger 26 апр. 2018, в 07:52
1

Он изменил свой ответ после того, как я опубликовал это исправление.
Jan 26 апр. 2018, в 12:33

13

Лучшим способом удаления недопустимого символа с пользовательского ввода является замена нелегального символа с помощью класса Regex, создание метода в коде позади или его проверка на стороне клиента с помощью элемента управления RegularExpression.

public string RemoveSpecialCharacters(string str)
{
    return Regex.Replace(str, "[^a-zA-Z0-9_]+", "_", RegexOptions.Compiled);
}

ИЛИ

<asp:RegularExpressionValidator ID="regxFolderName" 
                                runat="server" 
                                ErrorMessage="Enter folder name with  a-z A-Z0-9_" 
                                ControlToValidate="txtFolderName" 
                                Display="Dynamic" 
                                ValidationExpression="^[a-zA-Z0-9_]*$" 
                                ForeColor="Red">

anomepani 28 сен. 2013, в 07:41

4

ИМХО, это решение намного лучше, чем другие. Вместо поиска всех недопустимых символов просто определите, какие из них действительны.
igorushi 29 сен. 2015, в 07:55
0

Хорошее решение +1
Priyankara 02 окт. 2016, в 13:10

11

Вот фрагмент кода, который должен помочь для .NET 3 и выше.

using System.IO;
using System.Text.RegularExpressions;

public static class PathValidation
{
    private static string pathValidatorExpression = "^[^" + string.Join("", Array.ConvertAll(Path.GetInvalidPathChars(), x => Regex.Escape(x.ToString()))) + "]+$";
    private static Regex pathValidator = new Regex(pathValidatorExpression, RegexOptions.Compiled);

    private static string fileNameValidatorExpression = "^[^" + string.Join("", Array.ConvertAll(Path.GetInvalidFileNameChars(), x => Regex.Escape(x.ToString()))) + "]+$";
    private static Regex fileNameValidator = new Regex(fileNameValidatorExpression, RegexOptions.Compiled);

    private static string pathCleanerExpression = "[" + string.Join("", Array.ConvertAll(Path.GetInvalidPathChars(), x => Regex.Escape(x.ToString()))) + "]";
    private static Regex pathCleaner = new Regex(pathCleanerExpression, RegexOptions.Compiled);

    private static string fileNameCleanerExpression = "[" + string.Join("", Array.ConvertAll(Path.GetInvalidFileNameChars(), x => Regex.Escape(x.ToString()))) + "]";
    private static Regex fileNameCleaner = new Regex(fileNameCleanerExpression, RegexOptions.Compiled);

    public static bool ValidatePath(string path)
    {
        return pathValidator.IsMatch(path);
    }

    public static bool ValidateFileName(string fileName)
    {
        return fileNameValidator.IsMatch(fileName);
    }

    public static string CleanPath(string path)
    {
        return pathCleaner.Replace(path, "");
    }

    public static string CleanFileName(string fileName)
    {
        return fileNameCleaner.Replace(fileName, "");
    }
}

James 19 окт. 2010, в 18:20

8

В большинстве решений выше сочетаются незаконные символы для обоих путей и имени файла, что неверно (даже если оба вызова в настоящее время возвращают один и тот же набор символов). Сначала я разделил бы путь + имя файла в пути и имя файла, затем применил бы соответствующий набор к ним, если они есть, а затем снова объединить два.

wvd_vegt

wvd_vegt 19 июнь 2012, в 13:00

0

+1: очень верно. Сегодня, работая в .NET 4.0, решение regex из верхнего ответа уничтожило все обратные косые черты в полном пути. Поэтому я сделал регулярное выражение для пути dir и регулярное выражение только для имени файла, очищенное отдельно и повторно объединенное
dario_ramos 22 май 2013, в 21:03
0

Это может быть правдой, но это не отвечает на вопрос. Я не уверен, что расплывчатое «я бы сделал это так» ужасно полезно по сравнению с некоторыми из уже готовых решений (см., Например, ответ Лилли ниже)
Ian Grainger 12 май 2016, в 11:20

6

Если вы удалите или замените одним символом недопустимые символы, вы можете столкнуться с ошибками:

<abc -> abc
>abc -> abc

Вот простой способ избежать этого:

public static string ReplaceInvalidFileNameChars(string s)
{
    char[] invalidFileNameChars = System.IO.Path.GetInvalidFileNameChars();
    foreach (char c in invalidFileNameChars)
        s = s.Replace(c.ToString(), "[" + Array.IndexOf(invalidFileNameChars, c) + "]");
    return s;
}

Результат:

 <abc -> [1]abc
 >abc -> [2]abc

Maxence 01 окт. 2014, в 19:41

5

Выбросьте исключение.

if ( fileName.IndexOfAny(Path.GetInvalidFileNameChars()) > -1 )
            {
                throw new ArgumentException();
            }

mirezus 12 март 2009, в 16:58

4

Я написал это чудовище для удовольствия, он позволяет вам совершать кругооборот:

public static class FileUtility
{
    private const char PrefixChar = '%';
    private static readonly int MaxLength;
    private static readonly Dictionary<char,char[]> Illegals;
    static FileUtility()
    {
        List<char> illegal = new List<char> { PrefixChar };
        illegal.AddRange(Path.GetInvalidFileNameChars());
        MaxLength = illegal.Select(x => ((int)x).ToString().Length).Max();
        Illegals = illegal.ToDictionary(x => x, x => ((int)x).ToString("D" + MaxLength).ToCharArray());
    }

    public static string FilenameEncode(string s)
    {
        var builder = new StringBuilder();
        char[] replacement;
        using (var reader = new StringReader(s))
        {
            while (true)
            {
                int read = reader.Read();
                if (read == -1)
                    break;
                char c = (char)read;
                if(Illegals.TryGetValue(c,out replacement))
                {
                    builder.Append(PrefixChar);
                    builder.Append(replacement);
                }
                else
                {
                    builder.Append(c);
                }
            }
        }
        return builder.ToString();
    }

    public static string FilenameDecode(string s)
    {
        var builder = new StringBuilder();
        char[] buffer = new char[MaxLength];
        using (var reader = new StringReader(s))
        {
            while (true)
            {
                int read = reader.Read();
                if (read == -1)
                    break;
                char c = (char)read;
                if (c == PrefixChar)
                {
                    reader.Read(buffer, 0, MaxLength);
                    var encoded =(char) ParseCharArray(buffer);
                    builder.Append(encoded);
                }
                else
                {
                    builder.Append(c);
                }
            }
        }
        return builder.ToString();
    }

    public static int ParseCharArray(char[] buffer)
    {
        int result = 0;
        foreach (char t in buffer)
        {
            int digit = t - '0';
            if ((digit < 0) || (digit > 9))
            {
                throw new ArgumentException("Input string was not in the correct format");
            }
            result *= 10;
            result += digit;
        }
        return result;
    }
}

Johan Larsson 07 дек. 2013, в 14:25

1

Мне нравится это, потому что это позволяет избежать двух разных строк, создающих один и тот же путь.
Kim 29 янв. 2014, в 16:25

3

Я думаю, что гораздо легче проверить использование регулярного выражения и указать, какие символы разрешены, вместо того, чтобы пытаться проверить все плохие символы. См. Следующие ссылки: http://www.c-sharpcorner.com/UploadFile/prasad_1/RegExpPSD12062005021717AM/RegExpPSD.aspx http://www.windowsdevcenter.com/pub/a/oreilly/windows/news/csharp_0101.html

Кроме того, выполните поиск в редакторе регулярных выражений, они многое помогут. Есть некоторые, вокруг которых даже вывести код в С# для вас.

Sandor Davidhazi 28 сен. 2008, в 16:42

0

Учитывая, что .net - это фреймворк, предназначенный для запуска программ на нескольких платформах (например, Linux / Unix, а также Windows), я считаю, что Path.GetInvalidFileNameChars () лучше, поскольку он будет содержать сведения о том, что есть или нет. Не действует в файловой системе, в которой выполняется ваша программа. Даже если ваша программа никогда не будет работать в Linux (возможно, она полна кода WPF), всегда есть вероятность, что в будущем появится какая-то новая файловая система Windows с другими действительными / недействительными символами. Свернуть свое собственное с помощью регулярных выражений - это заново изобрести колесо и перенести проблему с платформой в свой собственный код.
Daniel Scott 03 окт. 2018, в 23:54
0

Я согласен с вашим советом по редакторам / тестерам онлайн-регулярных выражений. Я нахожу их бесценными (поскольку регулярные выражения - это хитрые вещи, полные тонкости, которые могут легко сбить вас с толку, давая вам регулярное выражение, которое ведет себя каким-то дико неожиданным образом с крайними случаями). Мой фаворит - regex101.com (мне нравится, как он разбивает регулярное выражение и ясно показывает, что он должен соответствовать). Мне также очень нравится debuggex.com, так как он имеет компактное визуальное представление групп совпадений и классов символов и еще много чего.
Daniel Scott 04 окт. 2018, в 00:05

2

public static class StringExtensions
      {
        public static string RemoveUnnecessary(this string source)
        {
            string result = string.Empty;
            string regex = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());
            Regex reg = new Regex(string.Format("[{0}]", Regex.Escape(regex)));
            result = reg.Replace(source, "");
            return result;
        }
    }

Вы можете использовать метод четко.

aemre 22 фев. 2018, в 12:06

2

Сканирование по ответам здесь, все они **, похоже, связаны с использованием массива char недопустимых имен файлов.

Разумеется, это может быть микрооптимизация - но для тех, кто мог бы проверить большое количество значений для действительных имен файлов, стоит отметить, что создание хешета недопустимых символов приведет к значительно лучшей производительности,

В прошлом я был очень удивлен (потрясен), насколько быстро хешсет (или словарь) превосходит итерирование по списку. Со строками это смехотворно низкое число (около 5-7 предметов из памяти). С большинством других простых данных (ссылки на объекты, числа и т.д.) Магический кроссовер, кажется, составляет около 20 элементов.

В списке Path.InvalidFileNameChars имеется 40 недопустимых символов. Был ли поиск сегодня и там довольно хороший тест здесь, на StackOverflow, который показывает, что hashset займет чуть более половины времени массива/списка для 40 элементов: https://stackoverflow.com/questions/150750/hashset-vs-list-performance

Здесь класс-помощник, который я использую для дезинфекции путей. Я забыл, почему у меня появился вариант замены, но он там как милый бонус.

Дополнительный бонусный метод "IsValidLocalPath" тоже:)

(** те, которые не используют регулярные выражения)

public static class PathExtensions
{
    private static HashSet<char> _invalidFilenameChars;
    private static HashSet<char> InvalidFilenameChars
    {
        get { return _invalidFilenameChars ?? (_invalidFilenameChars = new HashSet<char>(Path.GetInvalidFileNameChars())); }
    }


    /// <summary>Replaces characters in <c>text</c> that are not allowed in file names with the 
    /// specified replacement character.</summary>
    /// <param name="text">Text to make into a valid filename. The same string is returned if 
    /// it is valid already.</param>
    /// <param name="replacement">Replacement character, or NULL to remove bad characters.</param>
    /// <param name="fancyReplacements">TRUE to replace quotes and slashes with the non-ASCII characters " and ⁄.</param>
    /// <returns>A string that can be used as a filename. If the output string would otherwise be empty, "_" is returned.</returns>
    public static string ToValidFilename(this string text, char? replacement = '_', bool fancyReplacements = false)
    {
        StringBuilder sb = new StringBuilder(text.Length);
        HashSet<char> invalids = InvalidFilenameChars;
        bool changed = false;

        for (int i = 0; i < text.Length; i++)
        {
            char c = text[i];
            if (invalids.Contains(c))
            {
                changed = true;
                char repl = replacement ?? '\0';
                if (fancyReplacements)
                {
                    if (c == '"') repl = '"'; // U+201D right double quotation mark
                    else if (c == '\'') repl = '’'; // U+2019 right single quotation mark
                    else if (c == '/') repl = '⁄'; // U+2044 fraction slash
                }
                if (repl != '\0')
                    sb.Append(repl);
            }
            else
                sb.Append(c);
        }

        if (sb.Length == 0)
            return "_";

        return changed ? sb.ToString() : text;
    }


    /// <summary>
    /// Returns TRUE if the specified path is a valid, local filesystem path.
    /// </summary>
    /// <param name="pathString"></param>
    /// <returns></returns>
    public static bool IsValidLocalPath(this string pathString)
    {
        // From solution at https://stackoverflow.com/a/11636052/949129
        Uri pathUri;
        Boolean isValidUri = Uri.TryCreate(pathString, UriKind.Absolute, out pathUri);
        return isValidUri && pathUri != null && pathUri.IsLoopback;
    }
}

Daniel Scott 08 сен. 2017, в 01:41

2

Кажется, что это O (n) и не тратит слишком много памяти на строки:

    private static readonly HashSet<char> invalidFileNameChars = new HashSet<char>(Path.GetInvalidFileNameChars());

    public static string RemoveInvalidFileNameChars(string name)
    {
        if (!name.Any(c => invalidFileNameChars.Contains(c))) {
            return name;
        }

        return new string(name.Where(c => !invalidFileNameChars.Contains(c)).ToArray());
    }

Alexey F 09 фев. 2015, в 21:53

1

Я не думаю, что это O (n), когда вы используете функцию «Any».
II ARROWS 30 авг. 2016, в 10:42
0

@IIARROWS и что это по вашему мнению?
Alexey F 30 авг. 2016, в 12:32
0

Я не знаю, просто я так не чувствовал, когда писал свой комментарий ... теперь, когда я попытался его подсчитать, похоже, ты прав.
II ARROWS 30 авг. 2016, в 19:48

Показать ещё 1 комментарий

1

Имя файла не может содержать символы из символов Path.GetInvalidPathChars(), + и # и других конкретных имен. Мы объединили все проверки в один класс:

public static class FileNameExtensions
{
    private static readonly Lazy<string[]> InvalidFileNameChars =
        new Lazy<string[]>(() => Path.GetInvalidPathChars()
            .Union(Path.GetInvalidFileNameChars()
            .Union(new[] { '+', '#' })).Select(c => c.ToString(CultureInfo.InvariantCulture)).ToArray());


    private static readonly HashSet<string> ProhibitedNames = new HashSet<string>
    {
        @"aux",
        @"con",
        @"clock$",
        @"nul",
        @"prn",

        @"com1",
        @"com2",
        @"com3",
        @"com4",
        @"com5",
        @"com6",
        @"com7",
        @"com8",
        @"com9",

        @"lpt1",
        @"lpt2",
        @"lpt3",
        @"lpt4",
        @"lpt5",
        @"lpt6",
        @"lpt7",
        @"lpt8",
        @"lpt9"
    };

    public static bool IsValidFileName(string fileName)
    {
        return !string.IsNullOrWhiteSpace(fileName)
            && fileName.All(o => !IsInvalidFileNameChar(o))
            && !IsProhibitedName(fileName);
    }

    public static bool IsProhibitedName(string fileName)
    {
        return ProhibitedNames.Contains(fileName.ToLower(CultureInfo.InvariantCulture));
    }

    private static string ReplaceInvalidFileNameSymbols([CanBeNull] this string value, string replacementValue)
    {
        if (value == null)
        {
            return null;
        }

        return InvalidFileNameChars.Value.Aggregate(new StringBuilder(value),
            (sb, currentChar) => sb.Replace(currentChar, replacementValue)).ToString();
    }

    public static bool IsInvalidFileNameChar(char value)
    {
        return InvalidFileNameChars.Value.Contains(value.ToString(CultureInfo.InvariantCulture));
    }

    public static string GetValidFileName([NotNull] this string value)
    {
        return GetValidFileName(value, @"_");
    }

    public static string GetValidFileName([NotNull] this string value, string replacementValue)
    {
        if (string.IsNullOrWhiteSpace(value))
        {
            throw new ArgumentException(@"value should be non empty", nameof(value));
        }

        if (IsProhibitedName(value))
        {
            return (string.IsNullOrWhiteSpace(replacementValue) ? @"_" : replacementValue) + value; 
        }

        return ReplaceInvalidFileNameSymbols(value, replacementValue);
    }

    public static string GetFileNameError(string fileName)
    {
        if (string.IsNullOrWhiteSpace(fileName))
        {
            return CommonResources.SelectReportNameError;
        }

        if (IsProhibitedName(fileName))
        {
            return CommonResources.FileNameIsProhibited;
        }

        var invalidChars = fileName.Where(IsInvalidFileNameChar).Distinct().ToArray();

        if(invalidChars.Length > 0)
        {
            return string.Format(CultureInfo.CurrentCulture,
                invalidChars.Length == 1 ? CommonResources.InvalidCharacter : CommonResources.InvalidCharacters,
                StringExtensions.JoinQuoted(@",", @"'", invalidChars.Select(c => c.ToString(CultureInfo.CurrentCulture))));
        }

        return string.Empty;
    }
}

Метод GetValidFileName заменяет все неверные данные на _.

Backs 25 июль 2018, в 13:22

1

public static bool IsValidFilename(string testName)
{
    return !new Regex("[" + Regex.Escape(new String(System.IO.Path.GetInvalidFileNameChars())) + "]").IsMatch(testName);
}

mbdavis 18 нояб. 2013, в 13:44

0

Один лайнер для очистки строки из любых незаконных символов для имен файлов Windows:

public static string CleanIllegalName(string p_testName) => new Regex(string.Format("[{0}]", Regex.Escape(new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars())))).Replace(p_testName, "");

Zananok 02 дек. 2018, в 03:11

0

Я создал метод расширения, который объединяет несколько предложений:

Удержание незаконных символов в хэш-наборе
Фильтрация символов ниже ascii 127. Поскольку Path.GetInvalidFileNameChars не включает все недопустимые символы, доступные с помощью ascii-кодов от 0 до 255. См. Здесь и MSDN
Возможность определить заменяющий символ

Источник:

public static class FileNameCorrector
{
    private static HashSet<char> invalid = new HashSet<char>(Path.GetInvalidFileNameChars());

    public static string ToValidFileName(this string name, char replacement = '\0')
    {
        var builder = new StringBuilder();
        foreach (var cur in name)
        {
            if (cur > 31 && cur < 128 && !invalid.Contains(cur))
            {
                builder.Append(cur);
            }
            else if (replacement != '\0')
            {
                builder.Append(replacement);
            }
        }

        return builder.ToString();
    }
}

schoetbi 14 июнь 2018, в 07:11

0

Я думаю, что вопрос уже не полный ответил... Ответы описывают только чистое имя файла ИЛИ путь... не оба. Вот мое решение:

private static string CleanPath(string path)
{
    string regexSearch = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());
    Regex r = new Regex(string.Format("[{0}]", Regex.Escape(regexSearch)));
    List<string> split = path.Split('\\').ToList();
    string returnValue = split.Aggregate(string.Empty, (current, s) => current + (r.Replace(s, "") + @"\"));
    returnValue = returnValue.TrimEnd('\\');
    return returnValue;
}

Suplanus 07 июль 2015, в 10:54

0

Это позволит вам хотеть и избегать столкновений

 static string SanitiseFilename(string key)
    {
        var invalidChars = Path.GetInvalidFileNameChars();
        var sb = new StringBuilder();
        foreach (var c in key)
        {
            var invalidCharIndex = -1;
            for (var i = 0; i < invalidChars.Length; i++)
            {
                if (c == invalidChars[i])
                {
                    invalidCharIndex = i;
                }
            }
            if (invalidCharIndex > -1)
            {
                sb.Append("_").Append(invalidCharIndex);
                continue;
            }

            if (c == '_')
            {
                sb.Append("__");
                continue;
            }

            sb.Append(c);
        }
        return sb.ToString();

    }

mcintyre321 19 сен. 2014, в 16:22

-5

Или вы можете просто сделать

[YOUR STRING].Replace('\\', ' ').Replace('/', ' ').Replace('"', ' ').Replace('*', ' ').Replace(':', ' ').Replace('?', ' ').Replace('<', ' ').Replace('>', ' ').Replace('|', ' ').Trim();

Danny Fallas 15 янв. 2014, в 21:40

Ещё вопросы

Trim удаляет символы из начала и конца строк. Тем не менее, вы, вероятно, должны спросить, почему данные являются недействительными, и вместо того, чтобы пытаться санировать / исправить данные, отклонить данные.
Имена стилей Unix недопустимы в Windows, и я не хочу иметь дело с 8.3 короткими именами.
GetInvalidFileNameChars() такие вещи, как: \ etc, из путей к папкам.
Path.GetInvalidPathChars() не похоже * или ?
Я проверил пять ответов на этот вопрос (временной цикл 100 000), и следующий метод самый быстрый. Регулярное выражение заняло 2-е место и было на 25% медленнее: открытая строка GetSafeFilename (string filename) {return string.Join ("_", filename.Split (Path.GetInvalidFileNameChars ())); }
Чтобы точно ответить на вопрос ОП, вам нужно будет использовать «» вместо «_», но ваш ответ, вероятно, относится к большинству из нас на практике. Я думаю, что замена нелегальных символов некоторыми легальными делается чаще.
Это фантастический ответ. Я не знаю о производительности, но это очень легко читать и понимать.
Я проверил пять методов из этого вопроса (временной цикл 100 000), и этот метод самый быстрый. Регулярное выражение заняло 2-е место и было на 25% медленнее, чем этот метод.
Фантастическая идея! Это должен быть принятый ответ.
Чтобы обратиться к комментарию @BH, можно просто использовать string.Concat (name.Split (Path.GetInvalidFileNameChars ()))
Это не сработало для меня. Метод не возвращает чистую строку. Он возвращает переданное имя файла как есть.
Что @Karan сказал, это не работает, оригинальная строка возвращается.
На самом деле вы можете сделать это с помощью Linq следующим образом: var invalid = new HashSet<char>(Path.GetInvalidPathChars()); return new string(originalString.Where(s => !invalid.Contains(s)).ToArray()) . Производительность, вероятно, не велика, но это, вероятно, не имеет значения.
@ Каран или Джон Какой вклад вы посылаете этой функции? Смотрите мой редактор для проверки этого метода.
Это просто - парни передавали строки с действительными символами. Проголосовал за прохладный агрегатный раствор.
Легко внедрить и поддерживать. Я преобразовал это в расширение строки в локальном пакете, чтобы использовать его во всех проектах «из коробки»
Очень хорошее решение, но очищает только имя файла (как указано), но не фактический путь, так как он рассматривает "\" как недопустимый символ и если у вас есть что-то вроде "\\ MyServer \ e $ \ demo \ Output \ Test \ 1111_joe_soap. pdf ", он возвращает" MyServere $ demoOutputTest1111_joe_soap.pdf "
Мне нравится этот способ: вы сохраняете в строке только разрешенные символы (которые есть не что иное, как массив символов).
Я знаю, что это старый вопрос, но это потрясающий ответ. Тем не менее, я хотел добавить, что в c # вы не можете приводить из char [] к строковым значениям либо неявно, либо явно (без ума, я знаю), поэтому вам нужно поместить его в строковый конструктор.
Я не подтвердил это, но я ожидаю, что Path.GetInvalidPathChars () будет надмножеством GetInvalidFileNameChars () и будет охватывать как имена файлов, так и пути, поэтому я, вероятно, использовал бы это вместо этого.
Это должно быть ответом вместо тех ужасно выглядящих записей Regex! ;)
@anjdreas на самом деле Path.GetInvalidPathChars () представляется подмножеством Path.GetInvalidFileNameChars (), а не наоборот. Например, Path.GetInvalidPathChars () не будет возвращать «?».
Это хороший ответ. Я использую как список имен файлов, так и список путей к файлам: ____________________________ строка cleanData = новая строка (data.Where (x =>! Path.GetInvalidFileNameChars (). Contains (x) &&! Path.GetInvalidPathChars (). Contains (x)). ToArray ());
Тогда в чем смысл Path.GetInvalidFileNameChars? Я ожидаю, что он вернет точно недопустимые символы для текущей системы, полагаясь на .NET, чтобы узнать, на какой файловой системе я работаю, и предоставив мне подходящие неверные символы. Если это не так, и он просто возвращает жестко закодированные символы, которые, во-первых, ненадежны, этот метод следует удалить, поскольку он имеет нулевое значение.
Я знаю, что это старый комментарий, но @Jan вы можете написать в другой файловой системе, может быть, поэтому есть предупреждение.
@ fantastik78 хороший момент, но в этом случае я хотел бы иметь дополнительный аргумент enum для указания моей удаленной FS. Если это слишком много усилий по обслуживанию (что наиболее вероятно), весь этот метод все еще плохая идея, потому что он дает неправильное представление о безопасности.
@ Ян, я полностью согласен с тобой, я просто спорил о предупреждении.
Интересно, что это своего рода «черный список» недопустимых символов. Не лучше ли «внести в белый список» только известные действительные символы здесь ?! Напоминает мне глупую идею "virusscanner" вместо разрешенных приложений из белого списка ....
обратите внимание на то, что имена файлов указаны в предупреждении. Это на самом деле говорит вам, что это не проверка самих имен файлов, а только недопустимые символы. Вы все еще можете иметь недопустимое имя файла, которое является зарезервированным словом. Кроме того, как бы вы добавили приложение в белый список? Я бы просто сделал так, чтобы у моего вируса было ваше имя и подпись.
Я особенно согласен со вторым советом.
Обычно я соглашусь со вторым, но у меня есть программа, которая генерирует имя файла и в некоторых ситуациях может содержать недопустимые символы. Поскольку моя программа генерирует недопустимые имена файлов, я думаю, что целесообразно удалить / заменить эти символы. (Просто указывает на действительный вариант использования)
Очень хитрое и интеллектуальное решение! Палец вверх
Этот код не работает по какой-то причине.
Странно, это работает на меня. Я проверю это дважды, когда получу шанс. Можете ли вы быть более конкретным и объяснить, что именно не работает для вас?
Это не сработает (по крайней мере, правильно), потому что вы не экранируете символы пути правильно, а некоторые из них имеют особое значение. Обратитесь к моему ответу, как это сделать.
@Jeff: Твоя версия все еще лучше, чем у Мэтью, если ты немного изменишь ее. Обратитесь к моему ответу о том, как.
Я также добавил бы некоторые другие недопустимые шаблоны имен файлов, которые можно найти в MSDN, и расширил бы ваше решение до следующего регулярного выражения: new Regex(String.Format("^(CON|PRN|AUX|NUL|CLOCK\$|COM[1-9]|LPT[1-9])(?=\..|$)|(^(\.+|\s+)$)|((\.+|\s+)$)|([{0}])", Regex.Escape(new String(Path.GetInvalidFileNameChars()))), RegexOptions.Compiled | RegexOptions.Singleline | RegexOptions.CultureInvariant); регулярное выражение new Regex(String.Format("^(CON|PRN|AUX|NUL|CLOCK\$|COM[1-9]|LPT[1-9])(?=\..|$)|(^(\.+|\s+)$)|((\.+|\s+)$)|([{0}])", Regex.Escape(new String(Path.GetInvalidFileNameChars()))), RegexOptions.Compiled | RegexOptions.Singleline | RegexOptions.CultureInvariant);
Но твой код такой же, как у Джеффса ?!
Он изменил свой ответ после того, как я опубликовал это исправление.
ИМХО, это решение намного лучше, чем другие. Вместо поиска всех недопустимых символов просто определите, какие из них действительны.
+1: очень верно. Сегодня, работая в .NET 4.0, решение regex из верхнего ответа уничтожило все обратные косые черты в полном пути. Поэтому я сделал регулярное выражение для пути dir и регулярное выражение только для имени файла, очищенное отдельно и повторно объединенное
Это может быть правдой, но это не отвечает на вопрос. Я не уверен, что расплывчатое «я бы сделал это так» ужасно полезно по сравнению с некоторыми из уже готовых решений (см., Например, ответ Лилли ниже)
Мне нравится это, потому что это позволяет избежать двух разных строк, создающих один и тот же путь.
Учитывая, что .net - это фреймворк, предназначенный для запуска программ на нескольких платформах (например, Linux / Unix, а также Windows), я считаю, что Path.GetInvalidFileNameChars () лучше, поскольку он будет содержать сведения о том, что есть или нет. Не действует в файловой системе, в которой выполняется ваша программа. Даже если ваша программа никогда не будет работать в Linux (возможно, она полна кода WPF), всегда есть вероятность, что в будущем появится какая-то новая файловая система Windows с другими действительными / недействительными символами. Свернуть свое собственное с помощью регулярных выражений - это заново изобрести колесо и перенести проблему с платформой в свой собственный код.
Я согласен с вашим советом по редакторам / тестерам онлайн-регулярных выражений. Я нахожу их бесценными (поскольку регулярные выражения - это хитрые вещи, полные тонкости, которые могут легко сбить вас с толку, давая вам регулярное выражение, которое ведет себя каким-то дико неожиданным образом с крайними случаями). Мой фаворит - regex101.com (мне нравится, как он разбивает регулярное выражение и ясно показывает, что он должен соответствовать). Мне также очень нравится debuggex.com, так как он имеет компактное визуальное представление групп совпадений и классов символов и еще много чего.
Я не думаю, что это O (n), когда вы используете функцию «Any».
Я не знаю, просто я так не чувствовал, когда писал свой комментарий ... теперь, когда я попытался его подсчитать, похоже, ты прав.

Matthew Scharley · Accepted Answer · 2008-09-28T16-17-00.000Z

414

Лучший ответ

Попробуйте что-то вроде этого:

string illegal = "\"M\"\\a/ry/ h**ad:>> a\\/:*?\"| li*tt|le|| la\"mb.?";
string invalid = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());

foreach (char c in invalid)
{
    illegal = illegal.Replace(c.ToString(), ""); 
}

Но я должен согласиться с комментариями, я бы, вероятно, попытался разобраться с источником незаконных путей, вместо того, чтобы пытаться калечить незаконный путь в законный, но, вероятно, непреднамеренный.

Изменить: Или потенциально "лучшее" решение, используя Regex's.

string illegal = "\"M\"\\a/ry/ h**ad:>> a\\/:*?\"| li*tt|le|| la\"mb.?";
string regexSearch = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());
Regex r = new Regex(string.Format("[{0}]", Regex.Escape(regexSearch)));
illegal = r.Replace(illegal, "");

Тем не менее, возникает вопрос, почему вы делаете это в первую очередь.

Matthew Scharley 28 сен. 2008, в 16:17

1

Я не знаю, стоит ли мне +1 ваш ответ за то, что у меня есть такое неэффективное решение, которое оттолкнет пользователя от этого пути, или мне нужно +1 ваш ответ за то, что он действительно отвечает на его вопрос! :)
user7116 28 сен. 2008, в 16:05
0

Интересно, является ли regex-replace более производительным здесь?
Michael Stum♦ 28 сен. 2008, в 16:07
0

@Michael Stum: они «скомпилированы» и должны быть своего рода конечным автоматом, но было бы наивно полагать, что они гарантированно будут более эффективными, чем цикл.
user7116 28 сен. 2008, в 16:10
0

В отношении длины пути это, вероятно, не будет иметь большого значения. На более длинной строке, я думаю, что регулярное выражение будет быстрее, хотя.
Matthew Scharley 28 сен. 2008, в 16:15
0

+1 за номер один в моем поиске Google
WOPR 27 март 2009, в 01:07
0

Я бы остановился на решении без регулярных выражений: оно, вероятно, будет более эффективным в большинстве случаев. Если вы используете решение регулярных выражений, измените string.Format () на просто «[» + »...». Если после замены специальных символов вы собираетесь рассматривать illegal как имя файла без пути, вам понадобится только Path.InvalidFileNameChars ().
Rory 19 авг. 2010, в 17:58
27

Нет необходимости добавлять два списка вместе. Список символов недопустимого имени файла содержит список символов недопустимого пути и содержит еще несколько. Вот списки обоих списков, приведенных к int: 34,60,62,124,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16, 17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,58,42,63,92,47 34,60,62,124,0,2 , 3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27 , 28,29,30,31
Sarel Botha 11 апр. 2011, в 18:12
6

@sjbotha это может быть правдой в Windows и реализации Microsoft .NET Я не хочу делать то же самое предположение для, скажем, моно под управлением Linux.
Matthew Scharley 17 апр. 2011, в 01:24
7

По поводу первого решения. Разве StringBuilder не должен быть более эффективным, чем строковые назначения?
epignosisx 30 дек. 2011, в 15:53
1

Если строка содержит китайские символы, решение может быть неудачным.
PerlDev 02 янв. 2012, в 05:13
0

@PerlDev: Вы действительно проверяли это? char актеры должны быть многобайтовым совместим ( sizeof(char) == 2 ), поэтому оно не должно быть проблемой. Решение регулярных выражений также должно быть в порядке.
Matthew Scharley 17 янв. 2012, в 08:47
3

В чем проблема с санитарной обработкой, Боб Таблс?
cregox 08 нояб. 2013, в 21:02
1

Поправьте меня, если я ошибаюсь, но вызов обоих Path.GetInvalidFileNameChars() и Path.GetInvalidPathChars() является излишним. Path.GetInvalidFileNameChars() одного должно быть достаточно.
Joey Adams 13 нояб. 2013, в 18:34
2

@JoeyAdams: см. Мой ответ Сарелу Боте. Одним словом, один является надмножеством другого в Windows. Лично я не хочу делать одну и ту же ставку на кроссплатформенность, а C # и .NET в целом получают все большую и более широкую аудиторию через Mono.
Matthew Scharley 15 нояб. 2013, в 08:18
5

Для чего стоит @MatthewScharley, реализация MonIn для GetInvalidPathChars () возвращает только 0x00, а GetInvalidFileNameChars () возвращает только 0x00 и '/' при работе на платформах, отличных от Windows. В Windows списки недопустимых символов намного длиннее, и GetInvalidPathChars () полностью дублируется внутри GetInvalidFileNameChars (). Это не изменится в обозримом будущем, поэтому все, что вы на самом деле делаете, это удваивает время, необходимое для выполнения этой функции, потому что вы беспокоитесь, что определение действительного пути скоро изменится. Что это не так.
Warren Rumak 27 янв. 2014, в 19:09
0

И давайте проясним это: эта часть исходного кода Mono не изменилась за восемь лет, за исключением незначительного улучшения в 2007 году.
Warren Rumak 27 янв. 2014, в 19:11
4

@Warren: не стесняйтесь дедуплицировать результирующую строку, если вы действительно обеспокоены, но давайте будем здесь совершенно честны: разница между 20 и 40 итерациями для строки будет равна длине вашего среднего пути (скажем, 100 символов, которые будут щедрыми) точно нет разницы во время выполнения вашей функции. Для всех практических целей не нужно беспокоиться об этом. С другой стороны, эти две функции служат разным целям, и (по крайней мере, на мой взгляд) было бы совершенно разумно, чтобы одна функция не возвращала расширенный набор другой для некоторой данной файловой системы.
Matthew Scharley 29 янв. 2014, в 05:40
1

Каким образом выполнение двойной работы (будь то дедупликация массива или двойное прохождение почти одинаковых значений массива) может занять "абсолютно никакой разницы"? Вы знаете так же хорошо, как и я, что это неправильно, так что не говорите. Мы пытаемся быть образовательным ресурсом в Stackoverflow, а не местом для риторических успехов, вызванных тем, что вам говорят, что вы не правы. Давайте проясним: то, что вы рекомендуете здесь, фактически совпадает со старым суждением Daily WTF о предоставлении вашего собственного определения TRUE и FALSE, потому что вы не можете доверять компилятору или библиотекам, чтобы всегда сделать это правильно.
Warren Rumak 29 янв. 2014, в 16:43
3

GetInvalidFileNameChars () всегда - ВСЕГДА, вы меня слышите, - собираетесь включать все в GetInvalidPathChars (), потому что для файла невозможно иметь символ, недопустимый в имени пути. Ни одна файловая система не позволяет этого сегодня, ни одна файловая система никогда этого не сделает. И в любом случае, собственная документация Microsoft для этих функций очень ясна, так как вы не должны ожидать, что список символов будет гарантированно точным, поскольку файловые системы в любом случае могут поддерживать что-то другое.
Warren Rumak 29 янв. 2014, в 16:52
3

Я бы, наверное, встал на сторону Мэтью и просто сказал, что предположение - мать всех ошибок. Вы говорите об оптимизации кода, который, вероятно, не нуждается в оптимизации по сравнению с потенциальной корректностью. Я бы взял правильность над преждевременной оптимизацией в любой день
Charleh 15 март 2014, в 17:50
9

@ Чарлех, это обсуждение так ненужно ... код всегда должен быть оптимизирован, и нет риска, что это будет неправильно. Имя файла также является частью пути. Поэтому просто нелогично, чтобы GetInvalidPathChars() мог содержать символы, которых GetInvalidFileNameChars() не будет. Вы не принимаете правильность над «преждевременной» оптимизацией. Вы просто используете плохой код.
Stefan Fabian 09 авг. 2014, в 11:54
1

Лично я предпочел бы этот путь: var invalid = Path.GetInvalidFileNameChars().Union(Path.GetInvalidPathChars()); foreach(char c in invalid) illegal = illegal.Replace(c.ToString(), "_");
Rango 09 сен. 2015, в 12:20
0

Спасибо за это. Я имею дело с пользовательским вводом для создания имени файла, и это замечательно!
Pwaddles 20 янв. 2018, в 12:40
0

Я не уверен, почему вы так любопытны, почему он хочет это использовать. Существуют различные законные сценарии, в которых это будет полезно. Например, наше приложение выводит файлы xlsx на электронную почту в виде отчетов, и если мы не проверим их при входе, до запланированного времени создания отчета вы не узнаете, что имя файла было недействительным. У нас были проблемы, когда в прошлом кто-то случайно вводил меньше, чем в имени файла, и сохранял его. Кроме того, некоторые из наших клиентов используют Linux, а некоторые - Windows, поэтому разрешенные файлы не совпадают.
John Lord 30 нояб. 2018, в 17:51

Показать ещё 22 комментария