Генерация случайных данных с использованием регулярных выражений

Java

Генерация случайных данных из регулярных выражений

адрес проекта

GitHub.com/GitHub-LA Word…

Установить

git clone https://github.com/GitHub-Laziji/reverse-regexp.git
cd reverse-regexp
mvn install
<dependency>
    <groupId>org.laziji.commons</groupId>
    <artifactId>reverse-regexp</artifactId>
    <version>1.0-SNAPSHOT</version>
</dependency>

использовать

синтаксис случайных символов

Поддерживает большинство синтаксиса сопоставления регулярных выражений

  • \dчисло, эквивалентное[0-9]
  • \wЦифры и буквы подчеркнуты, что эквивалентно[0-9a-zA-Z_]
  • \sпробельные символы, только пробелы и табуляции
  • .Удалить\nа также\rЛюбой символ, кромеasciiкод0~255генерируется между
  • [a-zA-Z甲乙]интервал, не поддерживается^грамматика
  • и другие персонажи

Повторить синтаксис печати

Тот же синтаксис, что и у повторяющегося совпадения регулярного выражения

  • ?Случайным образом сгенерировать 0 или 1 символ
  • *Произвольное создание более 0 символов, по умолчанию до 16
  • +Произвольное создание более 1 символа, по умолчанию до 16
  • {n}сгенерировать n символов
  • {n,}Произвольно сгенерировать n~ символов, по умолчанию не болееmax(16,n)индивидуальный
  • {n,m}Случайным образом сгенерировать n~m символов

другой синтаксис

  • |или синтаксис, например.aaa|bbb|cccГенерируется случайным образомaaaилиbbbилиccc, с равной вероятностью
  • ()скобки поддерживаются
public class MainTest {

    @Test
    public void test() throws RegexpIllegalException, UninitializedException, TypeNotMatchException {
        
        random("\\w{6,12}@[a-z0-9]{3}\\.(com|cn)", "邮箱");
        random("1(3|5|7|8)\\d{9}", "手机号");
        random("-?[1-9]\\d*\\.\\d+", "浮点数");
        random("https?://[\\w-]+(\\.[\\w-]+){1,2}(/[\\w-]{3,6}){0,2}(\\?[\\w_]{4,6}=[\\w_]{4,6}(&[\\w_]{4,6}=[\\w_]{4,6}){0,2})?", "网址");
    }
    
    private void random(String expression, String title)
            throws RegexpIllegalException, TypeNotMatchException, UninitializedException {
        
        System.out.println(title + " " + expression);
        Node node = new OrdinaryNode(expression);
        Pattern pattern = Pattern.compile(node.getExpression());
        for (int i = 0; i < 10; i++) {
            String data = node.random();
            System.out.println("[" + pattern.matcher(data).matches() + "] " + data);
        }
        System.out.println();
    }

}

выход

邮箱 \w{6,12}@[a-z0-9]{3}\.(com|cn)
[true] 19cZ8eISNA@9je.com
[true] xpv3wJ@i3h.cn
[true] 6qDUfY@1g9.com
[true] iVnZSMA373@6zd.cn
[true] I5wiX97@ffe.cn
[true] mwqA5sXQ@g8j.cn
[true] HUXiCem1Y0w@j98.cn
[true] 1jOQWsELF@u1o.cn
[true] _Q4QTvxPeMFh@bds.com
[true] 3xFH33Aa@6lh.cn

手机号 1(3|5|7|8)\d{9}
[true] 18263364656
[true] 17539493178
[true] 17452542895
[true] 15190699623
[true] 13441385631
[true] 15450856416
[true] 18651247283
[true] 13835809899
[true] 18595798569
[true] 17115703866

浮点数 -?[1-9]\d*\.\d+
[true] 8148340336.1501586550282701
[true] -3339660539.406
[true] -51.6120243661611419
[true] -731621835440468.9708278
[true] -27438753435.9137579
[true] 393811376.777268751417
[true] 3286498432415.3962664603
[true] -5299652275.9
[true] 216.93676279820770
[true] 34.36843273

网址 https?://[\w-]+(\.[\w-]+){1,2}(/[\w-]{3,6}){0,2}(\?[\w_]{4,6}=[\w_]{4,6}(&[\w_]{4,6}=[\w_]{4,6}){0,2})?
[true] https://a_fl.thx/4_4
[true] http://v3YTuJ0Gu-5z8.JGhpdLe/V2j/ndL-UO
[true] https://FuMG-gafEc.R2FRRtLyX/ahg
[true] https://5phYVK9.wh7vl9z3AAZVg.z-yQSiMTdQw8S9-/WKCd
[true] https://T9dntbI.4Su8vxYhCr6?T85gV=R6TYtm&1c97x=nCTyA5
[true] http://qHyDgqBtYwq6Stg8.I6gb-M_ripkiEafK?ZLxy=Itny&RmsTX=X7KEuW&bwuk2=frcjO6
[true] http://UJ.Yb3foKTJKy-uqKUl.ZXrrFUk9K/Dcymu?W2tasq=oqzS&hYGWD=MF6l&FMHOi=F6ct8T
[true] https://BY_iS.tnlclAvxMkuO.T90G5XETj/cQncGI
[true] http://hG.li8Nzv.uaGokB/CTnrqp
[true] https://huZmN.v-LtoY/Dyl/peq?NUmt=__QDXG&8GBY=wZ8M&AkKZl4=8NZfEt