jwe/octave: src/DLD-FUNCTIONS/regexp.cc annotate

annotate src/DLD-FUNCTIONS/regexp.cc @ 5785:6b9cec830d72

[project @ 2006-05-03 19:32:46 by dbateman]

author	dbateman
date	Wed, 03 May 2006 19:32:48 +0000
parents	12eeebfa7ead
children	beb5b95de2c0

rev	line source
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	2
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	3 Copyright (C) 2005 David Bateman
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	4 Copyright (C) 2002-2005 Paul Kienzle
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	5
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	6 Octave is free software; you can redistribute it and/or modify it
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	7 under the terms of the GNU General Public License as published by the
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	8 Free Software Foundation; either version 2, or (at your option) any
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	9 later version.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	10
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	11 Octave is distributed in the hope that it will be useful, but WITHOUT
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	12 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	13 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	14 for more details.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	15
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	16 You should have received a copy of the GNU General Public License
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	17 along with this program; see the file COPYING. If not, write to the
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	18 Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	19 Boston, MA 02110-1301, USA.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	20
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	21 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	22
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	23 #ifdef HAVE_CONFIG_H
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	24 #include <config.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	25 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	26
5773 5c1feeea5227 [project @ 2006-04-18 20:04:42 by jwe] jwe parents: 5765 diff changeset	27 #include <algorithm>
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	28 #include <sstream>
7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	29
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	30 #include "defun-dld.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	31 #include "error.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	32 #include "gripes.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	33 #include "oct-obj.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	34 #include "utils.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	35
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	36 #include "Cell.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	37 #include "oct-map.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	38 #include "str-vec.h"
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	39 #include "quit.h"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	40 #include "parse.h"
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	41
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	42 #ifdef HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	43 #include <pcre.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	44 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	45 #ifdef HAVE_REGEX
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	46 #ifdef __MINGW32__
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	47 #define __restrict
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	48 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	49 #include <regex.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	50 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	51 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	52
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	53 // The regexp is constructed as a linked list to avoid resizing the
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	54 // return values in arrays at each new match.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	55
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	56 // FIXME don't bother collecting and composing return values the user
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	57 // doesn't want.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	58
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	59 class regexp_elem
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	60 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	61 public:
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	62 regexp_elem (const string_vector _named_token, const Cell _t,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	63 const std::string _m, const Matrix _te, const double _s,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	64 const double _e) :
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	65 named_token (_named_token), t (_t), m (_m), te (_te), s (_s), e (_e) { }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	66
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	67 regexp_elem (const regexp_elem &a) : named_token (a.named_token), t (a.t),
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	68 m (a.m), te (a.te), s (a.s), e (a.e)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	69 { }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	70
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	71 string_vector named_token;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	72 Cell t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	73 std::string m;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	74 Matrix te;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	75 double s;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	76 double e;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	77 };
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	78
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	79 typedef std::list<regexp_elem>::const_iterator const_iterator;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	80
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	81 static int
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	82 octregexp_list (const octave_value_list &args, const std::string &nm,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	83 bool case_insensitive, std::list<regexp_elem> &lst,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	84 string_vector &named, int &nopts)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	85 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	86 int sz = 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	87 #if defined (HAVE_REGEX) \|\| defined (HAVE_PCRE)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	88 int nargin = args.length();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	89 bool once = false;
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	90 bool lineanchors = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	91 bool dotexceptnewline = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	92 bool freespacing = false;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	93
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	94 nopts = nargin - 2;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	95
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	96 if (nargin < 2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	97 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	98 print_usage(nm);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	99 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	100 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	101
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	102 std::string buffer = args(0).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	103 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	104 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	105 gripe_wrong_type_arg (nm.c_str(), args(0));
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	106 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	107 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	108
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	109 std::string pattern = args(1).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	110 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	111 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	112 gripe_wrong_type_arg (nm.c_str(), args(1));
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	113 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	114 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	115
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	116 for (int i = 2; i < nargin; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	117 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	118 std::string str = args(i).string_value();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	119 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	120 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	121 error ("%s: optional arguments must be strings", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	122 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	123 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	124 std::transform (str.begin (), str.end (), str.begin (), tolower);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	125 if (str.find("once", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	126 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	127 once = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	128 nopts--;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	129 }
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	130 else if (str.find("matchcase", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	131 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	132 case_insensitive = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	133 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	134 }
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	135 else if (str.find("ignorecase", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	136 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	137 case_insensitive = true;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	138 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	139 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	140 else if (str.find("dotall", 0) == 0)
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	141 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	142 dotexceptnewline = false;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	143 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	144 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	145 else if (str.find("stringanchors", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	146 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	147 lineanchors = false;
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	148 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	149 }
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	150 else if (str.find("literalspacing", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	151 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	152 freespacing = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	153 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	154 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	155 #if HAVE_PCRE
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	156 // Only accept these options with pcre
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	157 else if (str.find("dotexceptnewline", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	158 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	159 dotexceptnewline = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	160 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	161 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	162 else if (str.find("lineanchors", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	163 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	164 lineanchors = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	165 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	166 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	167 else if (str.find("freespacing", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	168 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	169 freespacing = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	170 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	171 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	172 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	173 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	174 str.find("tokens", 0) && str.find("names", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	175 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	176 #else
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	177 else if (str.find("names", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	178 str.find("dotexceptnewline", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	179 str.find("lineanchors", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	180 str.find("freespacing", 0) == 0)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	181 error ("%s: %s not implemented in this version", str.c_str(), nm.c_str());
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	182 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	183 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	184 str.find("tokens", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	185 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	186 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	187 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	188
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	189 if (!error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	190 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	191 Cell t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	192 std::string m;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	193 double s, e;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	194
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	195 // named tokens "(?<name>...)" are only treated with PCRE not regex.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	196 #if HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	197 // The syntax of named tokens in pcre is "(?P<name>...)" while we need
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	198 // a syntax "(?<name>...)", so fix that here. Also an expression like
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	199 // "(?<first>\w+)\s+(?<last>\w+)\|(?<last>\w+),\s+(?<first>\w+)" should
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	200 // be perfectly legal, while pcre does not allow the same named token
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	201 // name on both sides of the alternative. Also fix that here by replacing
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	202 // name tokens by dummy names, and dealing with the dummy names later.
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	203
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	204 size_t pos = 0;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	205 size_t new_pos;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	206 int nnames = 0;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	207 int inames = 0;
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	208 std::ostringstream buf;
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	209 Array<int> named_idx;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	210
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	211 while ((new_pos = pattern.find ("(?<",pos)) != NPOS)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	212 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	213 size_t tmp_pos = pattern.find_first_of ('>',new_pos);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	214
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	215 if (tmp_pos == NPOS)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	216 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	217 error ("syntax error in pattern");
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	218 break;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	219 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	220
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	221 std::string tmp_name = pattern.substr(new_pos+3,tmp_pos-new_pos-3);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	222 bool found = false;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	223
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	224 for (int i = 0; i < nnames; i++)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	225 if (named(i) == tmp_name)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	226 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	227 named_idx.resize(inames+1);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	228 named_idx(inames) = i;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	229 found = true;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	230 break;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	231 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	232 if (! found)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	233 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	234 named_idx.resize(inames+1);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	235 named_idx(inames) = nnames;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	236 named.append(tmp_name);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	237 nnames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	238 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	239
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	240 if (new_pos - pos > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	241 buf << pattern.substr(pos,new_pos-pos);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	242 if (inames < 10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	243 buf << "(?P<n00" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	244 else if (inames < 100)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	245 buf << "(?P<n0" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	246 else
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	247 buf << "(?P<n" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	248 pos = tmp_pos;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	249 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	250
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	251 buf << pattern.substr(pos);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	252
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	253 if (error_state)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	254 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	255
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	256 // Compile expression
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	257 pcre *re;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	258 const char *err;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	259 int erroffset;
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	260 std::string buf_str = buf.str ();
7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	261 re = pcre_compile (buf_str.c_str (),
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	262 (case_insensitive ? PCRE_CASELESS : 0) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	263 (dotexceptnewline ? 0 : PCRE_DOTALL) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	264 (lineanchors ? PCRE_MULTILINE : 0) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	265 (freespacing ? PCRE_EXTENDED : 0),
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	266 &err, &erroffset, NULL);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	267
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	268 if (re == NULL) {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	269 error("%s: %s at position %d of expression", nm.c_str(),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	270 err, erroffset);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	271 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	272 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	273
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	274 int subpatterns;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	275 int namecount;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	276 int nameentrysize;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	277 char *nametable;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	278 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	279
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	280 pcre_fullinfo(re, NULL, PCRE_INFO_CAPTURECOUNT, &subpatterns);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	281 pcre_fullinfo(re, NULL, PCRE_INFO_NAMECOUNT, &namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	282 pcre_fullinfo(re, NULL, PCRE_INFO_NAMEENTRYSIZE, &nameentrysize);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	283 pcre_fullinfo(re, NULL, PCRE_INFO_NAMETABLE, &nametable);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	284
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	285 OCTAVE_LOCAL_BUFFER(int, ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	286 OCTAVE_LOCAL_BUFFER(int, nidx, namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	287
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	288 for (int i = 0; i < namecount; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	289 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	290 // Index of subpattern in first two bytes MSB first of name.
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	291 // Extract index.
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	292 nidx[i] = (static_cast<int>(nametable[i*nameentrysize])) << 8 \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	293 static_cast<int>(nametable[i*nameentrysize+1]);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	294 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	295
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	296 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	297 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	298 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	299
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	300 int matches = pcre_exec(re, NULL, buffer.c_str(),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	301 buffer.length(), idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	302 (idx ? PCRE_NOTBOL : 0),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	303 ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	304
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	305 if (matches < 0 && matches != PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	306 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	307 error ("%s: internal error calling pcre_exec", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	308 pcre_free(re);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	309 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	310 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	311 else if (matches == PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	312 break;
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	313 else if (ovector[1] <= ovector[0])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	314 break;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	315 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	316 {
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	317 int pos_match = 0;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	318 Matrix te(matches-1,2);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	319 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	320 {
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	321 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	322 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	323 te(pos_match,0) = double (ovector[2*i]+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	324 te(pos_match++,1) = double (ovector[2*i+1]);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	325 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	326 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	327 te.resize(pos_match,2);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	328 s = double (ovector[0]+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	329 e = double (ovector[1]);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	330
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	331 const char **listptr;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	332 int status = pcre_get_substring_list(buffer.c_str(), ovector,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	333 matches, &listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	334
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	335 if (status == PCRE_ERROR_NOMEMORY) {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	336 error("%s: cannot allocate memory in pcre_get_substring_list",
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	337 nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	338 pcre_free(re);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	339 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	340 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	341
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	342 Cell cell_t (dim_vector(1,pos_match));
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	343 pos_match = 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	344 for (int i = 1; i < matches; i++)
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	345 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	346 cell_t(pos_match++) = std::string(*(listptr+i));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	347
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	348 m = std::string(*listptr);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	349 t = cell_t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	350
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	351 string_vector named_tokens(nnames);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	352 if (namecount > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	353 for (int i = 1; i < matches; i++)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	354 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	355 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	356 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	357 named_tokens(named_idx(i-1)) =
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	358 std::string(*(listptr+nidx[i-1]));
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	359 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	360 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	361
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	362 pcre_free_substring_list(listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	363
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	364 regexp_elem new_elem (named_tokens, t, m, te, s, e);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	365 lst.push_back (new_elem);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	366 idx = ovector[1];
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	367 sz++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	368
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	369 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	370 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	371
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	372 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	373 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	374
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	375 pcre_free(re);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	376 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	377 regex_t compiled;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	378 int err=regcomp(&compiled, pattern.c_str(), REG_EXTENDED \|
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	379 (case_insensitive ? REG_ICASE : 0));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	380 if (err)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	381 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	382 int len = regerror(err, &compiled, NULL, 0);
5760 8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	383 OCTAVE_LOCAL_BUFFER (char, errmsg, len);
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	384 regerror(err, &compiled, errmsg, len);
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	385 error("%s: %s in pattern (%s)", nm.c_str(), errmsg,
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	386 pattern.c_str());
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	387 regfree(&compiled);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	388 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	389 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	390
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	391 int subexpr = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	392 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	393 for (unsigned int i=0; i < pattern.length(); i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	394 subexpr += ( pattern[i] == '(' ? 1 : 0 );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	395 OCTAVE_LOCAL_BUFFER (regmatch_t, match, subexpr );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	396
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	397 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	398 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	399 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	400
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	401 if (regexec(&compiled, buffer.c_str() + idx, subexpr,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	402 match, (idx ? REG_NOTBOL : 0)) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	403 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	404 // Count actual matches
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	405 int matches = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	406 while (matches < subexpr && match[matches].rm_so >= 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	407 matches++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	408
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	409 s = double (match[0].rm_so+1+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	410 e = double (match[0].rm_eo+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	411 Matrix te(matches-1,2);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	412 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	413 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	414 te(i-1,0) = double (match[i].rm_so+1+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	415 te(i-1,1) = double (match[i].rm_eo+idx);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	416 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	417
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	418 m = buffer.substr (match[0].rm_so+idx,
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	419 match[0].rm_eo-match[0].rm_so);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	420
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	421 Cell cell_t (dim_vector(1,matches-1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	422 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	423 cell_t(i-1) = buffer.substr (match[i].rm_so+idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	424 match[i].rm_eo-match[i].rm_so);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	425 t = cell_t;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	426
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	427 idx += match[0].rm_eo;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	428
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	429 regexp_elem new_elem (Octave_map(), t, m, te, s, e);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	430 lst.push_back (new_elem);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	431 sz++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	432
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	433 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	434 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	435 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	436 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	437 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	438 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	439 regfree(&compiled);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	440 #endif
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	441 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	442 #else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	443 error ("%s: not available in this version of Octave", nm.c_str());
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	444 #endif
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	445 return sz;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	446 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	447
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	448 static octave_value_list
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	449 octregexp (const octave_value_list &args, int nargout, const std::string &nm,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	450 bool case_insensitive)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	451 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	452 octave_value_list retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	453 int nargin = args.length();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	454 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	455 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	456 int nopts;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	457 int sz = octregexp_list (args, nm, case_insensitive, lst, named, nopts);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	458
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	459 if (! error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	460 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	461 // Converted the linked list in the correct form for the return values
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	462
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	463 octave_idx_type i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	464 #ifdef HAVE_PCRE
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	465 Octave_map nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	466 if (sz == 1)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	467 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	468 for (int j = 0; j < named.length(); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	469 nmap.assign (named(j), lst.begin()->named_token(j));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	470 retval(5) = nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	471 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	472 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	473 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	474 for (int j = 0; j < named.length (); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	475 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	476 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	477 Cell tmp(dim_vector (1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	478 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	479 tmp(i++) = p->named_token(j);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	480 nmap.assign (named(j), octave_value (tmp));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	481 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	482 retval(5) = nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	483 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	484 #else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	485 retval(5) = Octave_map();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	486 #endif
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	487
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	488 Cell t (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	489 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	490 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	491 t(i++) = p->t;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	492 retval(4) = t;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	493
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	494 Cell m (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	495 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	496 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	497 m(i++) = p->m;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	498 retval(3) = m;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	499
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	500
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	501 Cell te (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	502 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	503 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	504 te(i++) = p->te;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	505 retval(2) = te;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	506
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	507 NDArray e (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	508 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	509 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	510 e(i++) = p->e;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	511 retval(1) = e;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	512
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	513 NDArray s (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	514 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	515 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	516 s(i++) = p->s;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	517 retval(0) = s;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	518
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	519 // Alter the order of the output arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	520 if (nopts > 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	521 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	522 int n = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	523 octave_value_list new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	524 new_retval.resize(nargout);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	525
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	526 OCTAVE_LOCAL_BUFFER (int, arg_used, 6);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	527 for (int j = 0; j < 6; j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	528 arg_used[j] = false;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	529
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	530 for (int j = 2; j < nargin; j++)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	531 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	532 int k = 0;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	533 std::string str = args(j).string_value();
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	534 std::transform (str.begin (), str.end (), str.begin (), tolower);
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	535 if (str.find("once", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	536 \|\| str.find("stringanchors", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	537 \|\| str.find("lineanchors", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	538 \|\| str.find("matchcase", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	539 \|\| str.find("ignorecase", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	540 \|\| str.find("dotall", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	541 \|\| str.find("dotexceptnewline", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	542 \|\| str.find("literalspacing", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	543 \|\| str.find("freespacing", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	544 )
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	545 continue;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	546 else if (str.find("start", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	547 k = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	548 else if (str.find("end", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	549 k = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	550 else if (str.find("tokenextents", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	551 k = 2;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	552 else if (str.find("match", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	553 k = 3;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	554 else if (str.find("tokens", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	555 k = 4;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	556 else if (str.find("names", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	557 k = 5;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	558
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	559 new_retval(n++) = retval(k);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	560 arg_used[k] = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	561
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	562 if (n == nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	563 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	564 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	565
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	566 // Fill in the rest of the arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	567 if (n < nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	568 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	569 for (int j = 0; j < 6; j++)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	570 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	571 if (! arg_used[j])
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	572 new_retval(n++) = retval(j);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	573 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	574 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	575
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	576 retval = new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	577 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	578 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	579
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	580 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	581 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	582
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	583 DEFUN_DLD (regexp, args, nargout,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	584 "-- texinfo --\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	585 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexp (@var{str}, @var{pat})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	586 @deftypefnx {Loadable Function} {[@dots{}] =} regexp (@var{str}, @var{pat}, @var{opts}, @dots{})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	587 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	588 Regular expression string matching. Matches @var{pat} in @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	589 returns the position and matching substrings or empty values if there are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	590 none.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	591 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	592 The matched pattern @var{pat} can include any of the standard regex\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	593 operators, including:\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	594 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	595 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	596 @item .\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	597 Match any character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	598 @item * + ? @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	599 Repetition operators, representing\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	600 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	601 @item *\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	602 Match zero or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	603 @item +\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	604 Match one or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	605 @item ?\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	606 Match zero or one times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	607 @item @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	608 Match range operator, which is of the form @code{@{@var{n}@}} to match exactly\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	609 @var{n} times, @code{@{@var{m},@}} to match @var{m} or more times,\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	610 @code{@{@var{m},@var{n}@}} to match between @var{m} and @var{n} times.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	611 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	612 @item [@dots{}] [^@dots{}]\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	613 List operators, where for example @code{[ab]c} matches @code{ac} and @code{bc}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	614 @item ()\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	615 Grouping operator\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	616 @item \|\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	617 Alternation operator. Match one of a choice of regular expressions. The\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	618 alternatives must be delimited by the grouoing operator @code{()} above\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	619 @item ^ $\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	620 Anchoring operator. @code{^} matches the start of the string @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	621 @code{$} the end\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	622 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	623 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	624 In addition the following escaped characters have special meaning. It should\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	625 be noted that it is recommended to quote @var{pat} in single quotes rather\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	626 than double quotes, to avoid the escape sequences being interpreted by octave\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	627 before being passed to @code{regexp}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	628 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	629 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	630 @item \\b\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	631 Match a word boundary\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	632 @item \\B\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	633 Match within a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	634 @item \\w\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	635 Matches any word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	636 @item \\W\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	637 Matches any non word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	638 @item \\<\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	639 Matches the beginning of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	640 @item \\>\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	641 Matches the end of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	642 @item \\s\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	643 Matches any whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	644 @item \\S\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	645 Matches any non whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	646 @item \\d\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	647 Matches any digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	648 @item \\D\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	649 Matches any non-digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	650 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	651 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	652 The outputs of @code{regexp} by default are in the order as given below\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	653 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	654 @table @asis\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	655 @item @var{s}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	656 The start indices of each of the matching substrings\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	657 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	658 @item @var{e}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	659 The end indices of each matching substring\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	660 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	661 @item @var{te}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	662 The extents of each of the matched token surrounded by @code{(@dots{})} in\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	663 @var{pat}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	664 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	665 @item @var{m}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	666 A cell array of the text of each match.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	667 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	668 @item @var{t}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	669 A cell array of the text of each token matched.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	670 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	671 @item @var{nm}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	672 A structure containing the text of each matched named token, with the name\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	673 being used as the fieldname. A named token is denoted as\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	674 @code{(?<name>@dots{})}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	675 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	676 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	677 Particular output arguments or the order of the output arguments can be\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	678 selected by additional @var{opts} arguments. These are strings and the\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	679 correspondence between the output arguments and the optional argument\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	680 are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	681 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	682 @multitable @columnfractions 0.2 0.3 0.3 0.2\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	683 @item @tab 'start' @tab @var{s} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	684 @item @tab 'end' @tab @var{e} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	685 @item @tab 'tokenExtents' @tab @var{te} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	686 @item @tab 'match' @tab @var{m} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	687 @item @tab 'tokens' @tab @var{t} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	688 @item @tab 'names' @tab @var{nm} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	689 @end multitable\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	690 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	691 A further optional argument is 'once', that limits the number of returned\n\
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	692 matches to the first match. Additional arguments are\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	693 \n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	694 @table @asis\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	695 @item matchcase\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	696 Make the matching case sensitive.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	697 @item ignorecase\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	698 Make the matching case insensitive.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	699 @item stringanchors\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	700 Match the anchor characters at the beginning and end of the string.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	701 @item lineanchors\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	702 Match the anchor characters at the beginning and end of the line.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	703 @item dotall\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	704 The character @code{.} matches the newline character.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	705 @item dotexceptnewline\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	706 The character @code{.} matches all but the newline character.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	707 @item freespacing\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	708 The pattern can include arbitrary whitespace and comments starting with\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	709 @code{#}.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	710 @item literalspacing\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	711 The pattern is taken literally.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	712 @end table\n\
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	713 @end deftypefn")
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	714 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	715 return octregexp (args, nargout, "regexp", false);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	716 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	717
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	718 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	719
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	720 ## seg-fault test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	721 %!assert(regexp("abcde","."),[1,2,3,4,5])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	722
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	723 ## Check that anchoring of pattern works correctly
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	724 %!assert(regexp('abcabc','^abc'),1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	725 %!assert(regexp('abcabc','abc$'),4);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	726 %!assert(regexp('abcabc','^abc$'),zeros(1,0));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	727
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	728 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	729 %! [s, e, te, m, t] = regexp(' No Match ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	730 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	731 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	732 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	733 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	734 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	735
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	736 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	737 %! [s, e, te, m, t] = regexp(' FiRetrUck ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	738 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	739 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	740 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	741 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	742 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	743
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	744 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	745 %! [s, e, te, m, t] = regexp(' firetruck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	746 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	747 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	748 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	749 %! assert (m{1}, 'firetruck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	750 %! assert (t{1}{1}, 'iretr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	751
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	752 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	753 %! [s, e, te, m, t] = regexp('short test string','\wr\w');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	754 %! assert (s,[1,12])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	755 %! assert (e,[5,17])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	756 %! assert (size(te), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	757 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	758 %! assert (isempty(te{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	759 %! assert (m{1},'short')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	760 %! assert (m{2},'string')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	761 %! assert (size(t), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	762 %! assert (isempty(t{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	763 %! assert (isempty(t{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	764
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	765 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	766 %! [s, e, te, m, t] = regexp('short test string','\wr\w','once');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	767 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	768 %! assert (e,5)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	769 %! assert (size(te), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	770 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	771 %! assert (m{1},'short')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	772 %! ## Matlab gives [1,0] here but that seems wrong.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	773 %! assert (size(t), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	774
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	775 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	776 %! [m, te, e, s, t] = regexp('short test string','\wr\w','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	777 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	778 %! assert (e,5)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	779 %! assert (size(te), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	780 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	781 %! assert (m{1},'short')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	782 %! ## Matlab gives [1,0] here but that seems wrong.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	783 %! assert (size(t), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	784
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	785 %!test
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	786 %! ## This test is expected to fail if PCRE is not installed
5620 0225507842a1 [project @ 2006-02-13 20:24:42 by dbateman] dbateman parents: 5619 diff changeset	787 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	788 %! [s, e, te, m, t, nm] = regexp('short test string','(?<word1>\wt)\s(?<word2>\w*t)');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	789 %! assert (s,1)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	790 %! assert (e,10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	791 %! assert (size(te), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	792 %! assert (te{1}, [1 5; 7, 10])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	793 %! assert (m{1},'short test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	794 %! assert (size(t),[1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	795 %! assert (t{1}{1},'short')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	796 %! assert (t{1}{2},'test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	797 %! assert (size(nm), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	798 %! assert (!isempty(fieldnames(nm)))
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	799 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	800 %! assert (nm.word1,'short')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	801 %! assert (nm.word2,'test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	802 %! endif
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	803
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	804 %!test
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	805 %! ## This test is expected to fail if PCRE is not installed
5620 0225507842a1 [project @ 2006-02-13 20:24:42 by dbateman] dbateman parents: 5619 diff changeset	806 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	807 %! [nm, m, te, e, s, t] = regexp('short test string','(?<word1>\wt)\s(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	808 %! assert (s,1)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	809 %! assert (e,10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	810 %! assert (size(te), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	811 %! assert (te{1}, [1 5; 7, 10])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	812 %! assert (m{1},'short test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	813 %! assert (size(t),[1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	814 %! assert (t{1}{1},'short')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	815 %! assert (t{1}{2},'test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	816 %! assert (size(nm), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	817 %! assert (!isempty(fieldnames(nm)))
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	818 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	819 %! assert (nm.word1,'short')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	820 %! assert (nm.word2,'test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	821 %! endif
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	822
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	823 %!test
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	824 %! ## This test is expected to fail if PCRE is not installed
5620 0225507842a1 [project @ 2006-02-13 20:24:42 by dbateman] dbateman parents: 5619 diff changeset	825 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	826 %! [t, nm] = regexp("John Davis\nRogers, James",'(?<first>\w+)\s+(?<last>\w+)\|(?<last>\w+),\s+(?<first>\w+)','tokens','names');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	827 %! assert (size(t), [1,2]);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	828 %! assert (t{1}{1},'John');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	829 %! assert (t{1}{2},'Davis');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	830 %! assert (t{2}{1},'Rogers');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	831 %! assert (t{2}{2},'James');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	832 %! assert (size(nm), [1,1]);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	833 %! assert (nm.first{1},'John');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	834 %! assert (nm.first{2},'James');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	835 %! assert (nm.last{1},'Davis');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	836 %! assert (nm.last{2},'Rogers');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	837 %! endif
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	838
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	839 %!assert(regexp("abc\nabc",'.'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	840 %!assert(regexp("abc\nabc",'.','dotall'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	841 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	842 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	843 %! assert(regexp("abc\nabc",'(?s).'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	844 %! assert(regexp("abc\nabc",'.','dotexceptnewline'),[1,2,3,5,6,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	845 %! assert(regexp("abc\nabc",'(?-s).'),[1,2,3,5,6,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	846 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	847
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	848 %!assert(regexp("caseCaSe",'case'),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	849 %!assert(regexp("caseCaSe",'case',"matchcase"),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	850 %!assert(regexp("caseCaSe",'case',"ignorecase"),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	851 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	852 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	853 %! assert(regexp("caseCaSe",'(?-i)case'),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	854 %! assert(regexp("caseCaSe",'(?i)case'),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	855 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	856
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	857 %!assert (regexp("abc\nabc",'c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	858 %!assert (regexp("abc\nabc",'c$',"stringanchors"),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	859 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	860 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	861 %! assert (regexp("abc\nabc",'(?-m)c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	862 %! assert (regexp("abc\nabc",'c$',"lineanchors"),[3,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	863 %! assert (regexp("abc\nabc",'(?m)c$'),[3,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	864 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	865
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	866 %!assert (regexp("this word",'s w'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	867 %!assert (regexp("this word",'s w','literalspacing'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	868 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	869 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	870 %! assert (regexp("this word",'(?-x)s w','literalspacing'),4)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	871 %! assert (regexp("this word",'s w','freespacing'),zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	872 %! assert (regexp("this word",'(?x)s w'),zeros(1,0))
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	873 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	874
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	875 %!error regexp('string', 'tri', 'BadArg');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	876 %!error regexp('string');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	877
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	878 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	879
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	880 DEFUN_DLD(regexpi, args, nargout,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	881 "-- texinfo --\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	882 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexpi (@var{str}, @var{pat})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	883 @deftypefnx {Loadable Function} {[@dots{}] =} regexpi (@var{str}, @var{pat}, @var{opts}, @dots{})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	884 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	885 Case insensitive regular expression string matching. Matches @var{pat} in\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	886 @var{str} and returns the position and matching substrings or empty values\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	887 if there are none. See @code{regexp} for more details\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	888 @end deftypefn")
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	889 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	890 return octregexp (args, nargout, "regexp", true);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	891 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	892
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	893 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	894
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	895 ## seg-fault test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	896 %!assert(regexpi("abcde","."),[1,2,3,4,5])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	897
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	898 ## Check that anchoring of pattern works correctly
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	899 %!assert(regexpi('abcabc','^abc'),1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	900 %!assert(regexpi('abcabc','abc$'),4);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	901 %!assert(regexpi('abcabc','^abc$'),zeros(1,0));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	902
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	903 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	904 %! [s, e, te, m, t] = regexpi(' No Match ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	905 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	906 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	907 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	908 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	909 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	910
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	911 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	912 %! [s, e, te, m, t] = regexpi(' FiRetrUck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	913 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	914 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	915 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	916 %! assert (m{1}, 'FiRetrUck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	917 %! assert (t{1}{1}, 'iRetr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	918
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	919 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	920 %! [s, e, te, m, t] = regexpi(' firetruck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	921 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	922 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	923 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	924 %! assert (m{1}, 'firetruck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	925 %! assert (t{1}{1}, 'iretr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	926
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	927 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	928 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\wr\w');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	929 %! assert (s,[1,12])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	930 %! assert (e,[5,17])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	931 %! assert (size(te), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	932 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	933 %! assert (isempty(te{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	934 %! assert (m{1},'ShoRt')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	935 %! assert (m{2},'String')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	936 %! assert (size(t), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	937 %! assert (isempty(t{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	938 %! assert (isempty(t{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	939
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	940 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	941 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\wr\w','once');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	942 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	943 %! assert (e,5)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	944 %! assert (size(te), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	945 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	946 %! assert (m{1},'ShoRt')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	947 %! ## Matlab gives [1,0] here but that seems wrong.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	948 %! assert (size(t), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	949
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	950 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	951 %! [m, te, e, s, t] = regexpi('ShoRt Test String','\wr\w','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	952 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	953 %! assert (e,5)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	954 %! assert (size(te), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	955 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	956 %! assert (m{1},'ShoRt')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	957 %! ## Matlab gives [1,0] here but that seems wrong.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	958 %! assert (size(t), [1,1])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	959
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	960 %!test
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	961 %! ## This test is expected to fail if PCRE is not installed
5620 0225507842a1 [project @ 2006-02-13 20:24:42 by dbateman] dbateman parents: 5619 diff changeset	962 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	963 %! [s, e, te, m, t, nm] = regexpi('ShoRt Test String','(?<word1>\wt)\s(?<word2>\w*t)');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	964 %! assert (s,1)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	965 %! assert (e,10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	966 %! assert (size(te), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	967 %! assert (te{1}, [1 5; 7, 10])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	968 %! assert (m{1},'ShoRt Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	969 %! assert (size(t),[1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	970 %! assert (t{1}{1},'ShoRt')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	971 %! assert (t{1}{2},'Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	972 %! assert (size(nm), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	973 %! assert (!isempty(fieldnames(nm)))
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	974 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	975 %! assert (nm.word1,'ShoRt')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	976 %! assert (nm.word2,'Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	977 %! endif
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	978
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	979 %!test
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	980 %! ## This test is expected to fail if PCRE is not installed
5620 0225507842a1 [project @ 2006-02-13 20:24:42 by dbateman] dbateman parents: 5619 diff changeset	981 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	982 %! [nm, m, te, e, s, t] = regexpi('ShoRt Test String','(?<word1>\wt)\s(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	983 %! assert (s,1)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	984 %! assert (e,10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	985 %! assert (size(te), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	986 %! assert (te{1}, [1 5; 7, 10])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	987 %! assert (m{1},'ShoRt Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	988 %! assert (size(t),[1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	989 %! assert (t{1}{1},'ShoRt')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	990 %! assert (t{1}{2},'Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	991 %! assert (size(nm), [1,1])
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	992 %! assert (!isempty(fieldnames(nm)))
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	993 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	994 %! assert (nm.word1,'ShoRt')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	995 %! assert (nm.word2,'Test')
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	996 %! endif
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	997
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	998 %!assert(regexpi("abc\nabc",'.'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	999 %!assert(regexpi("abc\nabc",'.','dotall'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1000 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1001 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1002 %! assert(regexpi("abc\nabc",'(?s).'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1003 %! assert(regexpi("abc\nabc",'.','dotexceptnewline'),[1,2,3,5,6,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1004 %! assert(regexpi("abc\nabc",'(?-s).'),[1,2,3,5,6,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1005 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1006
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1007 %!assert(regexpi("caseCaSe",'case'),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1008 %!assert(regexpi("caseCaSe",'case',"matchcase"),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1009 %!assert(regexpi("caseCaSe",'case',"ignorecase"),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1010 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1011 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1012 %! assert(regexpi("caseCaSe",'(?-i)case'),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1013 %! assert(regexpi("caseCaSe",'(?i)case'),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1014 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1015
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1016 %!assert (regexpi("abc\nabc",'c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1017 %!assert (regexpi("abc\nabc",'c$',"stringanchors"),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1018 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1019 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1020 %! assert (regexpi("abc\nabc",'(?-m)c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1021 %! assert (regexpi("abc\nabc",'c$',"lineanchors"),[3,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1022 %! assert (regexpi("abc\nabc",'(?m)c$'),[3,7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1023 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1024
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1025 %!assert (regexpi("this word",'s w'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1026 %!assert (regexpi("this word",'s w','literalspacing'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1027 %!test
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1028 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1029 %! assert (regexpi("this word",'(?-x)s w','literalspacing'),4)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1030 %! assert (regexpi("this word",'s w','freespacing'),zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1031 %! assert (regexpi("this word",'(?x)s w'),zeros(1,0))
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1032 %! endif
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1033
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1034 %!error regexpi('string', 'tri', 'BadArg');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1035 %!error regexpi('string');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1036
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1037 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1038
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1039 DEFUN_DLD(regexprep, args, ,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1040 "-- texinfo --\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1041 @deftypefn {Function File} @var{string} = regexprep(@var{string}, @var{pat}, @var{repstr}, @var{options})\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1042 Replace matches of @var{pat} in @var{string} with @var{repstr}.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1043 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1044 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1045 The replacement can contain @code{$i}, which subsubstitutes\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1046 for the ith set of parentheses in the match string. E.g.,\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1047 @example\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1048 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1049 regexprep(\"Bill Dunn\",'(\\w+) (\\w+)','$2, $1')\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1050 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1051 @end example\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1052 returns \"Dunn, Bill\"\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1053 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1054 @var{options} may be zero or more of\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1055 @table @samp\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1056 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1057 @item once\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1058 Replace only the first occurance of @var{pat} in the result.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1059 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1060 @item warnings\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1061 This option is present for compatibility but is ignored.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1062 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1063 @item ignorecase or matchcase\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1064 Ignore case for the pattern matching (see @code{regexpi}).\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1065 Alternatively, use (?i) or (?-i) in the pattern.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1066 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1067 @item lineanchors and stringanchors\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1068 Whether characters ^ and $ match the beginning and ending of lines.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1069 Alternatively, use (?m) or (?-m) in the pattern.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1070 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1071 @item dotexceptnewline and dotall\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1072 Whether . matches newlines in the string.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1073 Alternatively, use (?s) or (?-s) in the pattern.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1074 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1075 @item freespacing or literalspacing\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1076 Whether whitespace and # comments can be used to make the regular expression more readable.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1077 Alternatively, use (?x) or (?-x) in the pattern.\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1078 \n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1079 @end table\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1080 @seealso{regexp,regexpi}\n\
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1081 @end deftypefn")
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1082 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1083 octave_value_list retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1084
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1085 int nargin = args.length();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1086
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1087 if (nargin < 3)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1088 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1089 print_usage("regexprep");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1090 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1091 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1092
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1093 // Make sure we have string,pattern,replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1094 const std::string buffer = args(0).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1095 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1096 const std::string pattern = args(1).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1097 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1098 const std::string replacement = args(2).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1099 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1100
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1101 // Pack options excluding 'tokenize' and various output
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1102 // reordering strings into regexp arg list
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1103 octave_value_list regexpargs(nargin-1,octave_value());
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1104 regexpargs(0) = args(0);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1105 regexpargs(1) = args(1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1106 int len=2;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1107 for (int i = 3; i < nargin; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1108 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1109 const std::string opt = args(i).string_value();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1110 if (opt != "tokenize" && opt != "start" && opt != "end"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1111 && opt != "tokenextents" && opt != "match" && opt != "tokens"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1112 && opt != "names" && opt != "warnings")
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1113 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1114 regexpargs(len++) = args(i);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1115 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1116 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1117 regexpargs.resize(len);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1118
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1119 // Identify replacement tokens; build a vector of group numbers in
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1120 // the replacement string so that we can quickly calculate the size
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1121 // of the replacement.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1122 int tokens = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1123 for (size_t i=1; i < replacement.size(); i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1124 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1125 if (replacement[i-1]=='$' && isdigit(replacement[i]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1126 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1127 tokens++, i++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1128 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1129 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1130 std::vector<int> token(tokens);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1131 int kk = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1132 for (size_t i = 1; i < replacement.size(); i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1133 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1134 if (replacement[i-1]=='$' && isdigit(replacement[i]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1135 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1136 token[kk++] = replacement[i]-'0';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1137 i++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1138 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1139 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1140
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1141 // Perform replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1142 std::string rep;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1143 if (tokens > 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1144 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1145 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1146 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1147 int nopts;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1148 int sz = octregexp_list (regexpargs, "regexprep", false, lst, named,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1149 nopts);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1150
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1151 if (error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1152 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1153 if (sz == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1154 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1155 retval(0) = args(0);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1156 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1157 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1158
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1159 // Determine replacement length
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1160 const size_t replen = replacement.size() - 2*tokens;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1161 int delta = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1162 const_iterator p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1163 for (int i = 0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1164 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1165 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1166
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1167 const Matrix pairs(p->te);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1168 size_t pairlen = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1169 for (int j = 0; j < tokens; j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1170 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1171 if (token[j] == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1172 pairlen += static_cast<size_t>(p->e - p->s) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1173 else if (token[j] <= pairs.rows())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1174 pairlen += static_cast<size_t>(pairs(token[j]-1,1) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1175 pairs(token[j]-1,0)) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1176 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1177 delta += static_cast<int>(replen + pairlen) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1178 static_cast<int>(p->e - p->s + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1179 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1180 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1181
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1182 // Build replacement string
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1183 rep.reserve(buffer.size()+delta);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1184 size_t from = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1185 p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1186 for (int i=0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1187 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1188 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1189
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1190 const Matrix pairs(p->te);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1191 rep.append(&buffer[from], static_cast<size_t>(p->s - 1) - from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1192 from = static_cast<size_t>(p->e - 1) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1193 for (size_t j = 1; j < replacement.size(); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1194 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1195 if (replacement[j-1]=='$' && isdigit(replacement[j]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1196 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1197 int k = replacement[j]-'0';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1198 if (k == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1199 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1200 // replace with entire match
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1201 rep.append(&buffer[static_cast<size_t>(p->e - 1)],
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1202 static_cast<size_t>(p->e - p->s) + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1203 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1204 else if (k <= pairs.rows())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1205 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1206 // replace with group capture
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1207 rep.append(&buffer[static_cast<size_t>(pairs(k-1,0)-1)],
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1208 static_cast<size_t>(pairs(k-1,1) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1209 pairs(k-1,0))+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1210 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1211 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1212 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1213 // replace with nothing
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1214 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1215 j++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1216 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1217 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1218 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1219 rep.append(1,replacement[j-1]);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1220 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1221 if (j+1 == replacement.size())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1222 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1223 rep.append(1,replacement[j]);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1224 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1225 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1226 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1227 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1228 rep.append(&buffer[from],buffer.size()-from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1229 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1230 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1231 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1232 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1233 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1234 int nopts;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1235 int sz = octregexp_list (regexpargs, "regexprep", false, lst, named,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1236 nopts);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1237
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1238 if (error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1239 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1240 if (sz == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1241 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1242 retval(0) = args(0);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1243 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1244 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1245
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1246 // Determine replacement length
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1247 const size_t replen = replacement.size();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1248 int delta = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1249 const_iterator p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1250 for (int i = 0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1251 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1252 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1253 delta += static_cast<int>(replen) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1254 static_cast<int>(p->e - p->s + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1255 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1256 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1257
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1258 // Build replacement string
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1259 rep.reserve(buffer.size()+delta);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1260 size_t from = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1261 p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1262 for (int i=0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1263 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1264 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1265 rep.append(&buffer[from], static_cast<size_t>(p->s - 1) - from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1266 from = static_cast<size_t>(p->e - 1) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1267 rep.append(replacement);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1268 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1269 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1270 rep.append(&buffer[from],buffer.size()-from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1271 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1272
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1273 retval(0) = rep;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1274 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1275 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1276
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1277 /*
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1278 %!test # Replace with empty
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1279 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1280 %! t = regexprep(xml,'<[!?][^>]*>','');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1281 %! assert(t,' <tag v="hello">some stuff</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1282
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1283 %!test # Replace with non-empty
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1284 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1285 %! t = regexprep(xml,'<[!?][^>]*>','?');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1286 %! assert(t,'? <tag v="hello">some stuff?</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1287
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1288 %!test # Check that 'tokenize' is ignored
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1289 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1290 %! t = regexprep(xml,'<[!?][^>]*>','','tokenize');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1291 %! assert(t,' <tag v="hello">some stuff</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1292
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1293 %!test # Capture replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1294 %! if (!isempty(findstr(octave_config_info ("DEFS"),"HAVE_PCRE")))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1295 %! data = "Bob Smith\nDavid Hollerith\nSam Jenkins";
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1296 %! result = "Smith, Bob\nHollerith, David\nJenkins, Sam";
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1297 %! t = regexprep(data,'(?m)^(\w+)\s+(\w+)$','$2, $1');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1298 %! assert(t,result)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1299 %! end
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1300
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1301 # Return the original if no match
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1302 %!assert(regexprep('hello','world','earth'),'hello')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1303
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1304 ## Test a general replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1305 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Za-z0-9_]", "_"), "a_b_c_d_e_f_g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1306
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1307 ## Make sure it works at the beginning and end
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1308 %!assert(regexprep("a[b]c{d}e-f=g", "a", "_"), "_[b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1309 %!assert(regexprep("a[b]c{d}e-f=g", "g", "_"), "a[b]c{d}e-f=_");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1310
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1311 ## Options
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1312 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Za-z0-9_]", "_", "once"), "a_b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1313 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Z0-9_]", "_", "ignorecase"), "a_b_c_d_e_f_g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1314
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1315 ## Option combinations
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1316 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Z0-9_]", "_", "once", "ignorecase"), "a_b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1317
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1318 ## End conditions on replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1319 %!assert(regexprep("abc","(b)",".$1"),"a.bc");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1320 %!assert(regexprep("abc","(b)","$1"),"abc");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1321 %!assert(regexprep("abc","(b)","$1."),"ab.c");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1322 %!assert(regexprep("abc","(b)","$1.."),"ab..c");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1323
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1324 */
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1325
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1326 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1327 ;;; Local Variables: ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1328 ;;; mode: C++ ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1329 ;;; End: ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1330 */

Mercurial > jwe > octave

annotate src/DLD-FUNCTIONS/regexp.cc @ 5785:6b9cec830d72