jwe/octave: src/DLD-FUNCTIONS/regexp.cc annotate

author	jwe
date	Thu, 15 Dec 2005 01:10:05 +0000
parents
children	e9112ff172b1

rev	line source
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	2
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	3 Copyright (C) 2005 David Bateman
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	4 Copyright (C) 2002-2005 Paul Kienzle
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	5
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	6 Octave is free software; you can redistribute it and/or modify it
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	7 under the terms of the GNU General Public License as published by the
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	8 Free Software Foundation; either version 2, or (at your option) any
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	9 later version.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	10
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	11 Octave is distributed in the hope that it will be useful, but WITHOUT
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	12 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	13 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	14 for more details.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	15
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	16 You should have received a copy of the GNU General Public License
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	17 along with this program; see the file COPYING. If not, write to the
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	18 Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	19 Boston, MA 02110-1301, USA.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	20
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	21 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	22
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	23 // XXX FIXME XXX
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	24 // regexprep should be written as an m-file based on regexp
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	25
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	26 #ifdef HAVE_CONFIG_H
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	27 #include <config.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	28 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	29
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	30 #include "defun-dld.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	31 #include "error.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	32 #include "gripes.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	33 #include "oct-obj.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	34 #include "utils.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	35
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	36 #include "Cell.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	37 #include "oct-map.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	38 #include "str-vec.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	39
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	40 #ifdef HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	41 #include <pcre.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	42 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	43 #ifdef HAVE_REGEX
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	44 #ifdef __MINGW32__
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	45 #define __restrict
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	46 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	47 #include <regex.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	48 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	49 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	50
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	51 static octave_value_list
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	52 octregexp (const octave_value_list &args, int nargout, const std::string &nm,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	53 bool case_insensitive)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	54 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	55 octave_value_list retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	56 #if defined (HAVE_REGEX) \|\| defined (HAVE_PCRE)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	57 int nargin = args.length();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	58 int nopts = nargin - 2;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	59 bool once = false;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	60
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	61 if (nargin < 2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	62 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	63 print_usage(nm);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	64 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	65 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	66
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	67 std::string buffer = args(0).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	68 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	69 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	70 gripe_wrong_type_arg (nm.c_str(), args(0));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	71 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	72 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	73
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	74 std::string pattern = args(1).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	75 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	76 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	77 gripe_wrong_type_arg (nm.c_str(), args(1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	78 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	79 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	80
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	81 for (int i = 2; i < nargin; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	82 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	83 std::string str = args(i).string_value();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	84 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	85 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	86 error ("%s: optional arguments must be strings", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	87 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	88 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	89 std::transform (str.begin (), str.end (), str.begin (), tolower);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	90 if (str.find("once", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	91 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	92 once = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	93 nopts--;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	94 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	95 #ifdef HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	96 // XXX FIXME XXX named tokens still broken. Disable for now
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	97 #if 0
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	98 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	99 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	100 str.find("tokens", 0) && str.find("names", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	101 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	102 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	103 else if (str.find("names", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	104 error ("%s: named tokens not implemented in this version", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	105 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	106 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	107 str.find("tokens", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	108 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	109 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	110 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	111 else if (str.find("names", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	112 error ("%s: named tokens not implemented in this version", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	113 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	114 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	115 str.find("tokens", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	116 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	117 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	118 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	119
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	120 if (!error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	121 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	122 Octave_map nmap;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	123 Cell t, m, te;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	124 NDArray s, e;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	125
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	126 // named tokens "(?<name>...)" are only treated with PCRE not regex.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	127 #if HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	128 // The syntax of named tokens in pcre is "(?P<name>...)" while we need
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	129 // a syntax "(?<name>...)", so fix that here. Also an expression like
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	130 // "(?<first>\w+)\s+(?<last>\w+)\|(?<last>\w+),\s+(?<first>\w+)" should
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	131 // be perfectly legal, while pcre does not allow the same named token
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	132 // name of both sides of the alternative. Also fix that here by replacing
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	133 // duplicate name tokens by dummy names, and dealing with the dummy names
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	134 // later.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	135
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	136
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	137
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	138
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	139 // Compile expression
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	140 pcre *re;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	141 const char *err;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	142 int erroffset;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	143 re = pcre_compile(pattern.c_str(), (case_insensitive ? PCRE_CASELESS : 0),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	144 &err, &erroffset, NULL);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	145
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	146 if (re == NULL) {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	147 error("%s: %s at position %d of expression", nm.c_str(),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	148 err, erroffset);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	149 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	150 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	151
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	152 int subpatterns;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	153 int namecount;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	154 int nameentrysize;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	155 char *nametable;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	156 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	157 int sz = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	158
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	159 pcre_fullinfo(re, NULL, PCRE_INFO_CAPTURECOUNT, &subpatterns);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	160 pcre_fullinfo(re, NULL, PCRE_INFO_NAMECOUNT, &namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	161 pcre_fullinfo(re, NULL, PCRE_INFO_NAMEENTRYSIZE, &nameentrysize);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	162 pcre_fullinfo(re, NULL, PCRE_INFO_NAMETABLE, &nametable);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	163
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	164 OCTAVE_LOCAL_BUFFER(int, ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	165 OCTAVE_LOCAL_BUFFER(int, nidx, namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	166 string_vector names (namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	167
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	168 for (int i = 0; i < namecount; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	169 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	170 // Index of subpattern in first two bytes MSB first of name.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	171 // Extract name and index.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	172 nidx[i] = ((int)nametable[i*nameentrysize]) << 8 \|
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	173 (int)nametable[i*nameentrysize+1];
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	174 names(i) = std::string((&(nametable[i*nameentrysize+2])));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	175 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	176
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	177 Cell named_tokens(dim_vector(namecount,1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	178
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	179 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	180 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	181 int matches = pcre_exec(re, NULL, buffer.c_str(),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	182 buffer.length(), idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	183 (idx ? PCRE_NOTBOL : 0),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	184 ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	185
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	186 if (matches < 0 && matches != PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	187 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	188 error ("%s: internal error calling pcre_exec", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	189 pcre_free(re);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	190 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	191 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	192 else if (matches == PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	193 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	194 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	195 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	196 s.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	197 s(sz) = double (ovector[0]+1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	198 e.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	199 e(sz) = double (ovector[1]);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	200 te.resize(dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	201 Matrix mat_te(matches-1,2);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	202 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	203 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	204 mat_te(i-1,0) = double (ovector[2*i]+1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	205 mat_te(i-1,1) = double (ovector[2*i+1]);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	206 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	207 te(sz) = mat_te;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	208
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	209 const char **listptr;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	210 int status = pcre_get_substring_list(buffer.c_str(), ovector,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	211 matches, &listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	212
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	213 if (status == PCRE_ERROR_NOMEMORY) {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	214 error("%s: cannot allocate memory in pcre_get_substring_list",
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	215 nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	216 pcre_free(re);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	217 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	218 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	219
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	220 m.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	221 m(sz) = std::string(*listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	222
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	223 t.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	224 Cell cell_t (dim_vector(1,matches-1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	225 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	226 cell_t(i-1) = std::string(*(listptr+i));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	227 t(sz) = cell_t;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	228
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	229 for (int i = 0; i < namecount; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	230 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	231 Cell tmp = named_tokens(i);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	232 tmp.resize(dim_vector(1,sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	233 tmp(sz) =
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	234 std::string(*(listptr+nidx[i]));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	235 named_tokens(i) = tmp;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	236 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	237
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	238 pcre_free_substring_list(listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	239
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	240 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	241 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	242
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	243 idx = ovector[1];
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	244 sz++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	245 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	246 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	247
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	248 for (int i = 0; i < namecount; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	249 nmap.assign (names(i), named_tokens(i));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	250
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	251 pcre_free(re);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	252 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	253 regex_t compiled;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	254 int err=regcomp(&compiled, pattern.c_str(), REG_EXTENDED \|
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	255 (case_insensitive ? REG_ICASE : 0));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	256 if (err)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	257 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	258 int len = regerror(err, &compiled, NULL, 0);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	259 char errmsg = (char )malloc(len);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	260 if (errmsg)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	261 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	262 regerror(err, &compiled, errmsg, len);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	263 error("%s: %s in pattern (%s)", nm.c_str(), errmsg,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	264 pattern.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	265 free(errmsg);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	266 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	267 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	268 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	269 error("out of memory");
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	270 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	271 regfree(&compiled);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	272 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	273 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	274
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	275 int subexpr = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	276 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	277 int sz = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	278 for (unsigned int i=0; i < pattern.length(); i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	279 subexpr += ( pattern[i] == '(' ? 1 : 0 );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	280 OCTAVE_LOCAL_BUFFER (regmatch_t, match, subexpr );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	281
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	282 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	283 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	284 if (regexec(&compiled, buffer.c_str() + idx, subexpr,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	285 match, (idx ? REG_NOTBOL : 0)) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	286 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	287 // Count actual matches
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	288 int matches = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	289 while (matches < subexpr && match[matches].rm_so >= 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	290 matches++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	291
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	292 s.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	293 s(sz) = double (match[0].rm_so+1+idx);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	294 e.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	295 e(sz) = double (match[0].rm_eo+idx);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	296 te.resize(dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	297 Matrix mat_te(matches-1,2);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	298 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	299 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	300 mat_te(i-1,0) = double (match[i].rm_so+1+idx);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	301 mat_te(i-1,1) = double (match[i].rm_eo+idx);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	302 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	303 te(sz) = mat_te;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	304
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	305 m.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	306 m(sz) = buffer.substr (match[0].rm_so+idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	307 match[0].rm_eo-match[0].rm_so);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	308
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	309 t.resize (dim_vector(1, sz+1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	310 Cell cell_t (dim_vector(1,matches-1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	311 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	312 cell_t(i-1) = buffer.substr (match[i].rm_so+idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	313 match[i].rm_eo-match[i].rm_so);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	314 t(sz) = cell_t;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	315
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	316 idx += match[0].rm_eo;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	317 sz++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	318
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	319 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	320 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	321 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	322 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	323 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	324 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	325 regfree(&compiled);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	326 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	327
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	328 retval(5) = nmap;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	329 retval(4) = t;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	330 retval(3) = m;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	331 retval(2) = te;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	332 retval(1) = e;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	333 retval(0) = s;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	334
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	335 // Alter the order of the output arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	336 if (nopts > 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	337 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	338 int n = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	339 octave_value_list new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	340 new_retval.resize(nargout);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	341
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	342 OCTAVE_LOCAL_BUFFER (int, arg_used, 6);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	343 for (int i = 0; i < 6; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	344 arg_used[i] = false;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	345
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	346 for (int i = 2; i < nargin; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	347 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	348 int k = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	349 std::string str = args(i).string_value();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	350 std::transform (str.begin (), str.end (), str.begin (), tolower);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	351 if (str.find("once", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	352 continue;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	353 else if (str.find("start", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	354 k = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	355 else if (str.find("end", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	356 k = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	357 else if (str.find("tokenextents", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	358 k = 2;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	359 else if (str.find("match", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	360 k = 3;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	361 else if (str.find("tokens", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	362 k = 4;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	363 else if (str.find("names", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	364 k = 5;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	365
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	366 new_retval(n++) = retval(k);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	367 arg_used[k] = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	368
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	369 if (n == nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	370 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	371 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	372
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	373 // Fill in the rest of the arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	374 if (n < nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	375 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	376 for (int i = 0; i < 6; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	377 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	378 if (! arg_used[i])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	379 new_retval(n++) = retval(i);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	380 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	381 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	382
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	383 retval = new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	384 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	385 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	386
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	387 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	388 error ("%s: not available in this version of Octave", nm);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	389 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	390 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	391 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	392
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	393 DEFUN_DLD (regexp, args, nargout,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	394 "-- texinfo --\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	395 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexp (@var{str}, @var{pat})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	396 @deftypefnx {Loadable Function} {[@dots{}] =} regexp (@var{str}, @var{pat}, @var{opts}, @dots{})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	397 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	398 Regular expression string matching. Matches @var{pat} in @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	399 returns the position and matching substrings or empty values if there are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	400 none.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	401 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	402 The matched pattern @var{pat} can include any of the standard regex\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	403 operators, including:\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	404 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	405 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	406 @item .\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	407 Match any character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	408 @item * + ? @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	409 Repetition operators, representing\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	410 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	411 @item *\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	412 Match zero or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	413 @item +\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	414 Match one or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	415 @item ?\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	416 Match zero or one times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	417 @item @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	418 Match range operator, which is of the form @code{@{@var{n}@}} to match exactly\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	419 @var{n} times, @code{@{@var{m},@}} to match @var{m} or more times,\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	420 @code{@{@var{m},@var{n}@}} to match between @var{m} and @var{n} times.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	421 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	422 @item [@dots{}] [^@dots{}]\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	423 List operators, where for example @code{[ab]c} matches @code{ac} and @code{bc}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	424 @item ()\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	425 Grouping operator\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	426 @item \|\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	427 Alternation operator. Match one of a choice of regular expressions. The\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	428 alternatives must be delimited by the grouoing operator @code{()} above\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	429 @item ^ $\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	430 Anchoring operator. @code{^} matches the start of the string @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	431 @code{$} the end\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	432 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	433 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	434 In addition the following escaped characters have special meaning. It should\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	435 be noted that it is recommended to quote @var{pat} in single quotes rather\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	436 than double quotes, to avoid the escape sequences being interpreted by octave\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	437 before being passed to @code{regexp}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	438 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	439 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	440 @item \\b\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	441 Match a word boundary\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	442 @item \\B\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	443 Match within a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	444 @item \\w\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	445 Matches any word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	446 @item \\W\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	447 Matches any non word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	448 @item \\<\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	449 Matches the beginning of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	450 @item \\>\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	451 Matches the end of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	452 @item \\s\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	453 Matches any whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	454 @item \\S\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	455 Matches any non whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	456 @item \\d\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	457 Matches any digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	458 @item \\D\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	459 Matches any non-digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	460 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	461 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	462 The outputs of @code{regexp} by default are in the order as given below\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	463 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	464 @table @asis\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	465 @item @var{s}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	466 The start indices of each of the matching substrings\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	467 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	468 @item @var{e}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	469 The end indices of each matching substring\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	470 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	471 @item @var{te}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	472 The extents of each of the matched token surrounded by @code{(@dots{})} in\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	473 @var{pat}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	474 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	475 @item @var{m}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	476 A cell array of the text of each match.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	477 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	478 @item @var{t}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	479 A cell array of the text of each token matched.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	480 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	481 @item @var{nm}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	482 A structure containing the text of each matched named token, with the name\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	483 being used as the fieldname. A named token is denoted as\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	484 @code{(?<name>@dots{})}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	485 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	486 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	487 Particular output arguments or the order of the output arguments can be\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	488 selected by additional @var{opts} arguments. These are strings and the\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	489 correspondence between the output arguments and the optional argument\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	490 are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	491 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	492 @multitable @columnfractions 0.2 0.3 0.3 0.2\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	493 @item @tab 'start' @tab @var{s} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	494 @item @tab 'end' @tab @var{e} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	495 @item @tab 'tokenExtents' @tab @var{te} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	496 @item @tab 'match' @tab @var{m} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	497 @item @tab 'tokens' @tab @var{t} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	498 @item @tab 'names' @tab @var{nm} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	499 @end multitable\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	500 \n\

5582

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

1 /*

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

2

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

5

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

6 Octave is free software; you can redistribute it and/or modify it

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

7 under the terms of the GNU General Public License as published by the

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

8 Free Software Foundation; either version 2, or (at your option) any

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

9 later version.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

10

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

11 Octave is distributed in the hope that it will be useful, but WITHOUT

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

12 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

13 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

14 for more details.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

15

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

16 You should have received a copy of the GNU General Public License

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

17 along with this program; see the file COPYING. If not, write to the

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

18 Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

19 Boston, MA 02110-1301, USA.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

20

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

21 */

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

22

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

23 // XXX FIXME XXX

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

24 // regexprep should be written as an m-file based on regexp

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

25

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

26 #ifdef HAVE_CONFIG_H

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

27 #include <config.h>

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

28 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

29

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

30 #include "defun-dld.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

31 #include "error.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

32 #include "gripes.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

33 #include "oct-obj.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

34 #include "utils.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

35

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

36 #include "Cell.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

37 #include "oct-map.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

38 #include "str-vec.h"

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

39

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

40 #ifdef HAVE_PCRE

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

41 #include <pcre.h>

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

42 #else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

43 #ifdef HAVE_REGEX

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

44 #ifdef __MINGW32__

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

45 #define __restrict

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

46 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

47 #include <regex.h>

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

48 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

49 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

50

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

51 static octave_value_list

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

52 octregexp (const octave_value_list &args, int nargout, const std::string &nm,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

53 bool case_insensitive)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

54 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

55 octave_value_list retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

56 #if defined (HAVE_REGEX) || defined (HAVE_PCRE)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

57 int nargin = args.length();

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

58 int nopts = nargin - 2;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

59 bool once = false;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

60

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

61 if (nargin < 2)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

62 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

63 print_usage(nm);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

64 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

65 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

66

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

67 std::string buffer = args(0).string_value ();

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

68 if (error_state)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

69 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

70 gripe_wrong_type_arg (nm.c_str(), args(0));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

71 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

72 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

73

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

74 std::string pattern = args(1).string_value ();

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

75 if (error_state)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

76 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

77 gripe_wrong_type_arg (nm.c_str(), args(1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

78 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

79 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

80

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

81 for (int i = 2; i < nargin; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

82 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

83 std::string str = args(i).string_value();

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

84 if (error_state)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

85 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

86 error ("%s: optional arguments must be strings", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

87 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

88 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

89 std::transform (str.begin (), str.end (), str.begin (), tolower);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

90 if (str.find("once", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

91 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

92 once = true;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

93 nopts--;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

94 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

95 #ifdef HAVE_PCRE

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

96 // XXX FIXME XXX named tokens still broken. Disable for now

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

97 #if 0

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

98 else if (str.find("start", 0) && str.find("end", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

99 str.find("tokenextents", 0) && str.find("match", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

100 str.find("tokens", 0) && str.find("names", 0))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

101 error ("%s: unrecognized option", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

102 #else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

103 else if (str.find("names", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

104 error ("%s: named tokens not implemented in this version", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

105 else if (str.find("start", 0) && str.find("end", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

106 str.find("tokenextents", 0) && str.find("match", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

107 str.find("tokens", 0))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

108 error ("%s: unrecognized option", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

109 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

110 #else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

111 else if (str.find("names", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

112 error ("%s: named tokens not implemented in this version", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

113 else if (str.find("start", 0) && str.find("end", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

114 str.find("tokenextents", 0) && str.find("match", 0) &&

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

115 str.find("tokens", 0))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

116 error ("%s: unrecognized option", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

117 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

118 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

119

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

120 if (!error_state)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

121 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

122 Octave_map nmap;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

123 Cell t, m, te;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

124 NDArray s, e;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

125

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

126 // named tokens "(?<name>...)" are only treated with PCRE not regex.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

127 #if HAVE_PCRE

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

128 // The syntax of named tokens in pcre is "(?P<name>...)" while we need

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

129 // a syntax "(?<name>...)", so fix that here. Also an expression like

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

130 // "(?<first>\w+)\s+(?<last>\w+)|(?<last>\w+),\s+(?<first>\w+)" should

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

131 // be perfectly legal, while pcre does not allow the same named token

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

132 // name of both sides of the alternative. Also fix that here by replacing

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

133 // duplicate name tokens by dummy names, and dealing with the dummy names

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

134 // later.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

135

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

136

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

137

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

138

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

139 // Compile expression

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

140 pcre *re;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

141 const char *err;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

142 int erroffset;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

143 re = pcre_compile(pattern.c_str(), (case_insensitive ? PCRE_CASELESS : 0),

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

144 &err, &erroffset, NULL);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

145

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

146 if (re == NULL) {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

147 error("%s: %s at position %d of expression", nm.c_str(),

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

148 err, erroffset);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

149 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

150 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

151

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

152 int subpatterns;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

153 int namecount;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

154 int nameentrysize;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

155 char *nametable;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

156 int idx = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

157 int sz = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

158

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

159 pcre_fullinfo(re, NULL, PCRE_INFO_CAPTURECOUNT, &subpatterns);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

160 pcre_fullinfo(re, NULL, PCRE_INFO_NAMECOUNT, &namecount);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

161 pcre_fullinfo(re, NULL, PCRE_INFO_NAMEENTRYSIZE, &nameentrysize);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

162 pcre_fullinfo(re, NULL, PCRE_INFO_NAMETABLE, &nametable);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

163

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

164 OCTAVE_LOCAL_BUFFER(int, ovector, (subpatterns+1)*3);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

165 OCTAVE_LOCAL_BUFFER(int, nidx, namecount);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

166 string_vector names (namecount);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

167

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

168 for (int i = 0; i < namecount; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

169 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

170 // Index of subpattern in first two bytes MSB first of name.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

171 // Extract name and index.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

172 nidx[i] = ((int)nametable[i*nameentrysize]) << 8 |

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

173 (int)nametable[i*nameentrysize+1];

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

174 names(i) = std::string((&(nametable[i*nameentrysize+2])));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

175 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

176

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

177 Cell named_tokens(dim_vector(namecount,1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

178

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

179 while(true)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

180 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

181 int matches = pcre_exec(re, NULL, buffer.c_str(),

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

182 buffer.length(), idx,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

183 (idx ? PCRE_NOTBOL : 0),

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

184 ovector, (subpatterns+1)*3);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

185

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

186 if (matches < 0 && matches != PCRE_ERROR_NOMATCH)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

187 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

188 error ("%s: internal error calling pcre_exec", nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

189 pcre_free(re);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

190 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

191 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

192 else if (matches == PCRE_ERROR_NOMATCH)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

193 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

194 else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

195 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

196 s.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

197 s(sz) = double (ovector[0]+1);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

198 e.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

199 e(sz) = double (ovector[1]);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

200 te.resize(dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

201 Matrix mat_te(matches-1,2);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

202 for (int i = 1; i < matches; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

203 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

204 mat_te(i-1,0) = double (ovector[2*i]+1);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

205 mat_te(i-1,1) = double (ovector[2*i+1]);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

206 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

207 te(sz) = mat_te;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

208

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

209 const char **listptr;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

210 int status = pcre_get_substring_list(buffer.c_str(), ovector,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

211 matches, &listptr);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

212

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

213 if (status == PCRE_ERROR_NOMEMORY) {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

214 error("%s: cannot allocate memory in pcre_get_substring_list",

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

215 nm.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

216 pcre_free(re);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

217 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

218 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

219

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

220 m.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

221 m(sz) = std::string(*listptr);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

222

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

223 t.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

224 Cell cell_t (dim_vector(1,matches-1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

225 for (int i = 1; i < matches; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

226 cell_t(i-1) = std::string(*(listptr+i));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

227 t(sz) = cell_t;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

228

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

229 for (int i = 0; i < namecount; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

230 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

231 Cell tmp = named_tokens(i);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

232 tmp.resize(dim_vector(1,sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

233 tmp(sz) =

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

234 std::string(*(listptr+nidx[i]));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

235 named_tokens(i) = tmp;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

236 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

237

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

238 pcre_free_substring_list(listptr);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

239

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

240 if (once)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

241 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

242

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

243 idx = ovector[1];

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

244 sz++;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

245 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

246 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

247

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

248 for (int i = 0; i < namecount; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

249 nmap.assign (names(i), named_tokens(i));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

250

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

251 pcre_free(re);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

252 #else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

253 regex_t compiled;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

254 int err=regcomp(&compiled, pattern.c_str(), REG_EXTENDED |

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

255 (case_insensitive ? REG_ICASE : 0));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

256 if (err)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

257 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

258 int len = regerror(err, &compiled, NULL, 0);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

259 char *errmsg = (char *)malloc(len);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

260 if (errmsg)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

261 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

262 regerror(err, &compiled, errmsg, len);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

263 error("%s: %s in pattern (%s)", nm.c_str(), errmsg,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

264 pattern.c_str());

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

265 free(errmsg);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

266 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

267 else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

268 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

269 error("out of memory");

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

270 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

271 regfree(&compiled);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

272 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

273 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

274

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

275 int subexpr = 1;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

276 int idx = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

277 int sz = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

278 for (unsigned int i=0; i < pattern.length(); i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

279 subexpr += ( pattern[i] == '(' ? 1 : 0 );

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

280 OCTAVE_LOCAL_BUFFER (regmatch_t, match, subexpr );

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

281

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

282 while(true)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

283 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

284 if (regexec(&compiled, buffer.c_str() + idx, subexpr,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

285 match, (idx ? REG_NOTBOL : 0)) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

286 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

287 // Count actual matches

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

288 int matches = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

289 while (matches < subexpr && match[matches].rm_so >= 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

290 matches++;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

291

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

292 s.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

293 s(sz) = double (match[0].rm_so+1+idx);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

294 e.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

295 e(sz) = double (match[0].rm_eo+idx);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

296 te.resize(dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

297 Matrix mat_te(matches-1,2);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

298 for (int i = 1; i < matches; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

299 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

300 mat_te(i-1,0) = double (match[i].rm_so+1+idx);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

301 mat_te(i-1,1) = double (match[i].rm_eo+idx);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

302 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

303 te(sz) = mat_te;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

304

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

305 m.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

306 m(sz) = buffer.substr (match[0].rm_so+idx,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

307 match[0].rm_eo-match[0].rm_so);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

308

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

309 t.resize (dim_vector(1, sz+1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

310 Cell cell_t (dim_vector(1,matches-1));

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

311 for (int i = 1; i < matches; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

312 cell_t(i-1) = buffer.substr (match[i].rm_so+idx,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

313 match[i].rm_eo-match[i].rm_so);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

314 t(sz) = cell_t;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

315

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

316 idx += match[0].rm_eo;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

317 sz++;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

318

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

319 if (once)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

320 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

321 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

322 else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

323 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

324 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

325 regfree(&compiled);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

326 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

327

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

328 retval(5) = nmap;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

329 retval(4) = t;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

330 retval(3) = m;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

331 retval(2) = te;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

332 retval(1) = e;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

333 retval(0) = s;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

334

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

335 // Alter the order of the output arguments

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

336 if (nopts > 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

337 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

338 int n = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

339 octave_value_list new_retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

340 new_retval.resize(nargout);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

341

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

342 OCTAVE_LOCAL_BUFFER (int, arg_used, 6);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

343 for (int i = 0; i < 6; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

344 arg_used[i] = false;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

345

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

346 for (int i = 2; i < nargin; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

347 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

348 int k = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

349 std::string str = args(i).string_value();

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

350 std::transform (str.begin (), str.end (), str.begin (), tolower);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

351 if (str.find("once", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

352 continue;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

353 else if (str.find("start", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

354 k = 0;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

355 else if (str.find("end", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

356 k = 1;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

357 else if (str.find("tokenextents", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

358 k = 2;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

359 else if (str.find("match", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

360 k = 3;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

361 else if (str.find("tokens", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

362 k = 4;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

363 else if (str.find("names", 0) == 0)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

364 k = 5;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

365

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

366 new_retval(n++) = retval(k);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

367 arg_used[k] = true;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

368

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

369 if (n == nargout)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

370 break;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

371 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

372

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

373 // Fill in the rest of the arguments

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

374 if (n < nargout)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

375 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

376 for (int i = 0; i < 6; i++)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

377 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

378 if (! arg_used[i])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

379 new_retval(n++) = retval(i);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

380 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

381 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

382

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

383 retval = new_retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

384 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

385 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

386

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

387 #else

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

388 error ("%s: not available in this version of Octave", nm);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

389 #endif

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

390 return retval;

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

391 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

392

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

393 DEFUN_DLD (regexp, args, nargout,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

394 "-*- texinfo -*-\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

395 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexp (@var{str}, @var{pat})\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

396 @deftypefnx {Loadable Function} {[@dots{}] =} regexp (@var{str}, @var{pat}, @var{opts}, @dots{})\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

397 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

398 Regular expression string matching. Matches @var{pat} in @var{str} and\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

399 returns the position and matching substrings or empty values if there are\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

400 none.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

401 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

402 The matched pattern @var{pat} can include any of the standard regex\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

403 operators, including:\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

404 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

405 @table @code\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

406 @item .\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

407 Match any character\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

408 @item * + ? @{@}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

409 Repetition operators, representing\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

410 @table @code\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

411 @item *\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

412 Match zero or more times\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

413 @item +\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

414 Match one or more times\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

415 @item ?\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

416 Match zero or one times\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

417 @item @{@}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

418 Match range operator, which is of the form @code{@{@var{n}@}} to match exactly\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

419 @var{n} times, @code{@{@var{m},@}} to match @var{m} or more times,\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

420 @code{@{@var{m},@var{n}@}} to match between @var{m} and @var{n} times.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

421 @end table\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

422 @item [@dots{}] [^@dots{}]\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

423 List operators, where for example @code{[ab]c} matches @code{ac} and @code{bc}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

424 @item ()\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

425 Grouping operator\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

426 @item |\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

427 Alternation operator. Match one of a choice of regular expressions. The\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

428 alternatives must be delimited by the grouoing operator @code{()} above\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

429 @item ^ $\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

430 Anchoring operator. @code{^} matches the start of the string @var{str} and\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

431 @code{$} the end\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

432 @end table\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

433 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

434 In addition the following escaped characters have special meaning. It should\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

435 be noted that it is recommended to quote @var{pat} in single quotes rather\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

436 than double quotes, to avoid the escape sequences being interpreted by octave\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

437 before being passed to @code{regexp}.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

438 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

439 @table @code\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

440 @item \\b\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

441 Match a word boundary\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

442 @item \\B\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

443 Match within a word\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

444 @item \\w\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

445 Matches any word character\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

446 @item \\W\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

447 Matches any non word character\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

448 @item \\<\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

449 Matches the beginning of a word\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

450 @item \\>\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

451 Matches the end of a word\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

452 @item \\s\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

453 Matches any whitespace character\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

454 @item \\S\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

455 Matches any non whitespace character\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

456 @item \\d\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

457 Matches any digit\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

458 @item \\D\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

459 Matches any non-digit\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

460 @end table\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

461 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

462 The outputs of @code{regexp} by default are in the order as given below\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

463 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

464 @table @asis\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

465 @item @var{s}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

466 The start indices of each of the matching substrings\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

467 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

468 @item @var{e}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

469 The end indices of each matching substring\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

470 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

471 @item @var{te}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

472 The extents of each of the matched token surrounded by @code{(@dots{})} in\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

473 @var{pat}.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

474 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

475 @item @var{m}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

476 A cell array of the text of each match.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

477 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

478 @item @var{t}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

479 A cell array of the text of each token matched.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

480 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

481 @item @var{nm}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

482 A structure containing the text of each matched named token, with the name\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

483 being used as the fieldname. A named token is denoted as\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

484 @code{(?<name>@dots{})}\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

485 @end table\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

486 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

487 Particular output arguments or the order of the output arguments can be\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

488 selected by additional @var{opts} arguments. These are strings and the\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

489 correspondence between the output arguments and the optional argument\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

490 are\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

491 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

492 @multitable @columnfractions 0.2 0.3 0.3 0.2\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

493 @item @tab 'start' @tab @var{s} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

494 @item @tab 'end' @tab @var{e} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

495 @item @tab 'tokenExtents' @tab @var{te} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

496 @item @tab 'match' @tab @var{m} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

497 @item @tab 'tokens' @tab @var{t} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

498 @item @tab 'names' @tab @var{nm} @tab\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

499 @end multitable\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

500 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

501 A further optional argument is 'once', that limits the number of returned\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

502 matches to the first match.\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

503 @end deftypefn")

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

504 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

505 return octregexp (args, nargout, "regexp", false);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

506 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

507

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

508 /*

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

509

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

510 ## seg-fault test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

511 %!assert(regexp("abcde","."),[1,2,3,4,5])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

512

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

513 ## Check that anchoring of pattern works correctly

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

514 %!assert(regexp('abcabc','^abc'),1);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

515 %!assert(regexp('abcabc','abc$'),4);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

516 %!assert(regexp('abcabc','^abc$'),[]);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

517

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

518 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

519 %! [s, e, te, m, t] = regexp(' No Match ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

520 %! assert (s,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

521 %! assert (e,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

522 %! assert (te,{})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

523 %! assert (m, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

524 %! assert (t, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

525

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

526 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

527 %! [s, e, te, m, t] = regexp(' FiRetrUck ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

528 %! assert (s,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

529 %! assert (e,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

530 %! assert (te,{})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

531 %! assert (m, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

532 %! assert (t, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

533

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

534 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

535 %! [s, e, te, m, t] = regexp(' firetruck ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

536 %! assert (s,2)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

537 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

538 %! assert (te{1},[3,7])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

539 %! assert (m{1}, 'firetruck')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

540 %! assert (t{1}{1}, 'iretr')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

541

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

542 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

543 %! [s, e, te, m, t] = regexp('short test string','\w*r\w*');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

544 %! assert (s,[1,12])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

545 %! assert (e,[5,17])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

546 %! assert (size(te), [1,2])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

547 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

548 %! assert (isempty(te{2}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

549 %! assert (m{1},'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

550 %! assert (m{2},'string')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

551 %! assert (size(t), [1,2])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

552 %! assert (isempty(t{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

553 %! assert (isempty(t{2}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

554

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

555 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

556 %! [s, e, te, m, t] = regexp('short test string','\w*r\w*','once');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

557 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

558 %! assert (e,5)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

559 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

560 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

561 %! assert (m{1},'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

562 %! ## Matlab gives [1,0] here but that seems wrong.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

563 %! assert (size(t), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

564

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

565 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

566 %! [m, te, e, s, t] = regexp('short test string','\w*r\w*','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

567 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

568 %! assert (e,5)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

569 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

570 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

571 %! assert (m{1},'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

572 %! ## Matlab gives [1,0] here but that seems wrong.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

573 %! assert (size(t), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

574

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

575 ## XXX FIXME XXX Disable test for now as PCRE version not written

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

576 %!#test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

577 %! ## This test is expected to fail if PCRE is not installed

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

578 %! [s, e, te, m, t, nm] = regexp('short test string','(?<word1>\w*t)\s*(?<word2>\w*t)');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

579 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

580 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

581 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

582 %! assert (te{1}, [1 5; 7, 10])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

583 %! assert (m{1},'short test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

584 %! assert (size(t),[1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

585 %! assert (t{1}{1},'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

586 %! assert (t{1}{2},'test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

587 %! assert (size(nm), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

588 %! assert (isempty(fieldnames(nm)))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

589 %! assert (sort(fieldnames(nm)),{'word1','word2'})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

590 %! assert (nm.word1,'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

591 %! assert (nm.word2,'test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

592

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

593 ## XXX FIXME XXX Disable test for now as PCRE version not written

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

594 %!#test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

595 %! ## This test is expected to fail if PCRE is not installed

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

596 %! [nm, m, te, e, s, t] = regexp('short test string','(?<word1>\w*t)\s*(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

597 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

598 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

599 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

600 %! assert (te{1}, [1 5; 7, 10])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

601 %! assert (m{1},'short test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

602 %! assert (size(t),[1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

603 %! assert (t{1}{1},'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

604 %! assert (t{1}{2},'test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

605 %! assert (size(nm), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

606 %! assert (isempty(fieldnames(nm)))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

607 %! assert (sort(fieldnames(nm)),{'word1','word2'})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

608 %! assert (nm.word1,'short')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

609 %! assert (nm.word2,'test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

610

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

611 %!error regexp('string', 'tri', 'BadArg');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

612 %!error regexp('string');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

613

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

614 */

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

615

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

616 DEFUN_DLD(regexpi, args, nargout,

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

617 "-*- texinfo -*-\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

618 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexpi (@var{str}, @var{pat})\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

619 @deftypefnx {Loadable Function} {[@dots{}] =} regexpi (@var{str}, @var{pat}, @var{opts}, @dots{})\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

620 \n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

621 Case insensitive regular expression string matching. Matches @var{pat} in\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

622 @var{str} and returns the position and matching substrings or empty values\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

623 if there are none. See @code{regexp} for more details\n\

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

624 @end deftypefn")

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

625 {

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

626 return octregexp (args, nargout, "regexp", true);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

627 }

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

628

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

629 /*

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

630

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

631 ## seg-fault test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

632 %!assert(regexpi("abcde","."),[1,2,3,4,5])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

633

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

634 ## Check that anchoring of pattern works correctly

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

635 %!assert(regexpi('abcabc','^abc'),1);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

636 %!assert(regexpi('abcabc','abc$'),4);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

637 %!assert(regexpi('abcabc','^abc$'),[]);

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

638

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

639 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

640 %! [s, e, te, m, t] = regexpi(' No Match ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

641 %! assert (s,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

642 %! assert (e,[])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

643 %! assert (te,{})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

644 %! assert (m, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

645 %! assert (t, {})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

646

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

647 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

648 %! [s, e, te, m, t] = regexpi(' FiRetrUck ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

649 %! assert (s,2)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

650 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

651 %! assert (te{1},[3,7])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

652 %! assert (m{1}, 'FiRetrUck')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

653 %! assert (t{1}{1}, 'iRetr')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

654

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

655 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

656 %! [s, e, te, m, t] = regexpi(' firetruck ', 'f(.*)uck');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

657 %! assert (s,2)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

658 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

659 %! assert (te{1},[3,7])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

660 %! assert (m{1}, 'firetruck')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

661 %! assert (t{1}{1}, 'iretr')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

662

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

663 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

664 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\w*r\w*');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

665 %! assert (s,[1,12])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

666 %! assert (e,[5,17])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

667 %! assert (size(te), [1,2])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

668 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

669 %! assert (isempty(te{2}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

670 %! assert (m{1},'ShoRt')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

671 %! assert (m{2},'String')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

672 %! assert (size(t), [1,2])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

673 %! assert (isempty(t{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

674 %! assert (isempty(t{2}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

675

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

676 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

677 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\w*r\w*','once');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

678 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

679 %! assert (e,5)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

680 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

681 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

682 %! assert (m{1},'ShoRt')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

683 %! ## Matlab gives [1,0] here but that seems wrong.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

684 %! assert (size(t), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

685

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

686 %!test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

687 %! [m, te, e, s, t] = regexpi('ShoRt Test String','\w*r\w*','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

688 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

689 %! assert (e,5)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

690 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

691 %! assert (isempty(te{1}))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

692 %! assert (m{1},'ShoRt')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

693 %! ## Matlab gives [1,0] here but that seems wrong.

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

694 %! assert (size(t), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

695

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

696 ## XXX FIXME XXX Disable test for now as PCRE version not written

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

697 %!#test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

698 %! ## This test is expected to fail if PCRE is not installed

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

699 %! [s, e, te, m, t, nm] = regexpi('ShoRt Test String','(?<word1>\w*t)\s*(?<word2>\w*t)');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

700 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

701 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

702 %! assert (size(te), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

703 %! assert (te{1}, [1 5; 7, 10])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

704 %! assert (m{1},'ShoRt Test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

705 %! assert (size(t),[1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

706 %! assert (t{1}{1},'ShoRt')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

707 %! assert (t{1}{2},'Test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

708 %! assert (size(nm), [1,1])

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

709 %! assert (isempty(fieldnames(nm)))

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

710 %! assert (sort(fieldnames(nm)),{'word1','word2'})

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

711 %! assert (nm.word1,'ShoRt')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

712 %! assert (nm.word2,'Test')

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

713

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

714 ## XXX FIXME XXX Disable test for now as PCRE version not written

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

715 %!#test

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

716 %! ## This test is expected to fail if PCRE is not installed

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

717 %! [nm, m, te, e, s, t] = regexpi('ShoRt Test String','(?<word1>\w*t)\s*(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

718 %! assert (s,1)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe

parents:

diff changeset

719 %! assert (e,10)

6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe]

jwe