octave-nkf: src/DLD-FUNCTIONS/regexp.cc annotate

annotate src/DLD-FUNCTIONS/regexp.cc @ 8021:85184151822e

fix typo in NPOS change

author	John W. Eaton <jwe@octave.org>
date	Thu, 07 Aug 2008 15:31:17 -0400
parents	0ef13e15319b
children	dcc31f473596

rev	line source
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	2
7017 a1dbe9d80eee [project @ 2007-10-12 21:27:11 by jwe] jwe parents: 7016 diff changeset	3 Copyright (C) 2005, 2006, 2007 David Bateman
7016 93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	4 Copyright (C) 2002, 2003, 2004, 2005 Paul Kienzle
93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	5
93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	6 This file is part of Octave.
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	7
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	8 Octave is free software; you can redistribute it and/or modify it
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	9 under the terms of the GNU General Public License as published by the
7016 93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	10 Free Software Foundation; either version 3 of the License, or (at your
93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	11 option) any later version.
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	12
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	13 Octave is distributed in the hope that it will be useful, but WITHOUT
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	16 for more details.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	17
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	18 You should have received a copy of the GNU General Public License
7016 93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	19 along with Octave; see the file COPYING. If not, see
93c65f2a5668 [project @ 2007-10-12 06:40:56 by jwe] jwe parents: 7007 diff changeset	20 <http://www.gnu.org/licenses/>.
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	21
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	22 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	23
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	24 #ifdef HAVE_CONFIG_H
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	25 #include <config.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	26 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	27
5773 5c1feeea5227 [project @ 2006-04-18 20:04:42 by jwe] jwe parents: 5765 diff changeset	28 #include <algorithm>
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	29 #include <sstream>
7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	30
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	31 #include "defun-dld.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	32 #include "error.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	33 #include "gripes.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	34 #include "oct-obj.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	35 #include "utils.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	36
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	37 #include "Cell.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	38 #include "oct-map.h"
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	39 #include "str-vec.h"
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	40 #include "quit.h"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	41 #include "parse.h"
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	42
7173 ff2ff2c09865 [project @ 2007-11-14 18:20:49 by jwe] jwe parents: 7117 diff changeset	43 #if defined (HAVE_PCRE)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	44 #include <pcre.h>
7117 373c39904877 [project @ 2007-11-07 18:48:00 by jwe] jwe parents: 7017 diff changeset	45 #elif defined (HAVE_REGEX)
373c39904877 [project @ 2007-11-07 18:48:00 by jwe] jwe parents: 7017 diff changeset	46 #if defined (__MINGW32__)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	47 #define __restrict
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	48 #endif
7237 7e248dd1e6d5 [project @ 2007-12-03 19:52:47 by jwe] jwe parents: 7173 diff changeset	49 #if defined (HAVE_SYS_TYPES_H)
7e248dd1e6d5 [project @ 2007-12-03 19:52:47 by jwe] jwe parents: 7173 diff changeset	50 #include <sys/types.h>
7e248dd1e6d5 [project @ 2007-12-03 19:52:47 by jwe] jwe parents: 7173 diff changeset	51 #endif
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	52 #include <regex.h>
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	53 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	54
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	55 // The regexp is constructed as a linked list to avoid resizing the
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	56 // return values in arrays at each new match.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	57
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	58 // FIXME don't bother collecting and composing return values the user
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	59 // doesn't want.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	60
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	61 class regexp_elem
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	62 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	63 public:
5787 beb5b95de2c0 [project @ 2006-05-04 01:18:34 by jwe] jwe parents: 5785 diff changeset	64 regexp_elem (const string_vector& _named_token, const Cell& _t,
beb5b95de2c0 [project @ 2006-05-04 01:18:34 by jwe] jwe parents: 5785 diff changeset	65 const std::string& _m, const Matrix& _te, double _s,
beb5b95de2c0 [project @ 2006-05-04 01:18:34 by jwe] jwe parents: 5785 diff changeset	66 double _e) :
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	67 named_token (_named_token), t (_t), m (_m), te (_te), s (_s), e (_e) { }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	68
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	69 regexp_elem (const regexp_elem &a) : named_token (a.named_token), t (a.t),
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	70 m (a.m), te (a.te), s (a.s), e (a.e)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	71 { }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	72
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	73 string_vector named_token;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	74 Cell t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	75 std::string m;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	76 Matrix te;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	77 double s;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	78 double e;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	79 };
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	80
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	81 typedef std::list<regexp_elem>::const_iterator const_iterator;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	82
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	83 static int
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	84 octregexp_list (const octave_value_list &args, const std::string &nm,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	85 bool case_insensitive, std::list<regexp_elem> &lst,
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	86 string_vector &named, int &nopts, bool &once)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	87 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	88 int sz = 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	89 #if defined (HAVE_REGEX) \|\| defined (HAVE_PCRE)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	90 int nargin = args.length();
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	91 bool lineanchors = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	92 bool dotexceptnewline = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	93 bool freespacing = false;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	94
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	95 nopts = nargin - 2;
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	96 once = false;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	97
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	98 std::string buffer = args(0).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	99 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	100 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	101 gripe_wrong_type_arg (nm.c_str(), args(0));
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	102 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	103 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	104
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	105 std::string pattern = args(1).string_value ();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	106 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	107 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	108 gripe_wrong_type_arg (nm.c_str(), args(1));
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	109 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	110 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	111
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	112 for (int i = 2; i < nargin; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	113 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	114 std::string str = args(i).string_value();
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	115 if (error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	116 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	117 error ("%s: optional arguments must be strings", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	118 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	119 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	120 std::transform (str.begin (), str.end (), str.begin (), tolower);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	121 if (str.find("once", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	122 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	123 once = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	124 nopts--;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	125 }
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	126 else if (str.find("matchcase", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	127 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	128 case_insensitive = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	129 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	130 }
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	131 else if (str.find("ignorecase", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	132 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	133 case_insensitive = true;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	134 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	135 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	136 else if (str.find("dotall", 0) == 0)
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	137 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	138 dotexceptnewline = false;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	139 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	140 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	141 else if (str.find("stringanchors", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	142 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	143 lineanchors = false;
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	144 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	145 }
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	146 else if (str.find("literalspacing", 0) == 0)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	147 {
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	148 freespacing = false;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	149 nopts--;
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	150 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	151 #if HAVE_PCRE
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	152 // Only accept these options with pcre
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	153 else if (str.find("dotexceptnewline", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	154 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	155 dotexceptnewline = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	156 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	157 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	158 else if (str.find("lineanchors", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	159 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	160 lineanchors = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	161 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	162 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	163 else if (str.find("freespacing", 0) == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	164 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	165 freespacing = true;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	166 nopts--;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	167 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	168 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	169 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	170 str.find("tokens", 0) && str.find("names", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	171 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	172 #else
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	173 else if (str.find("names", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	174 str.find("dotexceptnewline", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	175 str.find("lineanchors", 0) == 0 \|\|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	176 str.find("freespacing", 0) == 0)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	177 error ("%s: %s not implemented in this version", str.c_str(), nm.c_str());
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	178 else if (str.find("start", 0) && str.find("end", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	179 str.find("tokenextents", 0) && str.find("match", 0) &&
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	180 str.find("tokens", 0))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	181 error ("%s: unrecognized option", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	182 #endif
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	183 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	184
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	185 if (!error_state)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	186 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	187 Cell t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	188 std::string m;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	189 double s, e;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	190
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	191 // named tokens "(?<name>...)" are only treated with PCRE not regex.
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	192 #if HAVE_PCRE
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	193 // The syntax of named tokens in pcre is "(?P<name>...)" while we need
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	194 // a syntax "(?<name>...)", so fix that here. Also an expression like
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	195 // "(?<first>\w+)\s+(?<last>\w+)\|(?<last>\w+),\s+(?<first>\w+)" should
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	196 // be perfectly legal, while pcre does not allow the same named token
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	197 // name on both sides of the alternative. Also fix that here by replacing
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	198 // name tokens by dummy names, and dealing with the dummy names later.
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	199
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	200 size_t pos = 0;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	201 size_t new_pos;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	202 int nnames = 0;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	203 int inames = 0;
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	204 std::ostringstream buf;
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	205 Array<int> named_idx;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	206
8021 85184151822e fix typo in NPOS change John W. Eaton <jwe@octave.org> parents: 8019 diff changeset	207 while ((new_pos = pattern.find ("(?<",pos)) != std::string::npos)
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	208 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	209 size_t tmp_pos = pattern.find_first_of ('>',new_pos);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	210
8021 85184151822e fix typo in NPOS change John W. Eaton <jwe@octave.org> parents: 8019 diff changeset	211 if (tmp_pos == std::string::npos)
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	212 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	213 error ("syntax error in pattern");
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	214 break;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	215 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	216
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	217 std::string tmp_name = pattern.substr(new_pos+3,tmp_pos-new_pos-3);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	218 bool found = false;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	219
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	220 for (int i = 0; i < nnames; i++)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	221 if (named(i) == tmp_name)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	222 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	223 named_idx.resize(inames+1);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	224 named_idx(inames) = i;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	225 found = true;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	226 break;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	227 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	228 if (! found)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	229 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	230 named_idx.resize(inames+1);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	231 named_idx(inames) = nnames;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	232 named.append(tmp_name);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	233 nnames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	234 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	235
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	236 if (new_pos - pos > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	237 buf << pattern.substr(pos,new_pos-pos);
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	238 if (inames < 10)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	239 buf << "(?P<n00" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	240 else if (inames < 100)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	241 buf << "(?P<n0" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	242 else
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	243 buf << "(?P<n" << inames++;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	244 pos = tmp_pos;
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	245 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	246
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	247 buf << pattern.substr(pos);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	248
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	249 if (error_state)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	250 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	251
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	252 // Compile expression
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	253 pcre *re;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	254 const char *err;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	255 int erroffset;
5765 7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	256 std::string buf_str = buf.str ();
7ba9ad1fec11 [project @ 2006-04-17 05:05:15 by jwe] jwe parents: 5760 diff changeset	257 re = pcre_compile (buf_str.c_str (),
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	258 (case_insensitive ? PCRE_CASELESS : 0) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	259 (dotexceptnewline ? 0 : PCRE_DOTALL) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	260 (lineanchors ? PCRE_MULTILINE : 0) \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	261 (freespacing ? PCRE_EXTENDED : 0),
7520 b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	262 &err, &erroffset, 0);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	263
7520 b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	264 if (re == 0) {
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	265 error("%s: %s at position %d of expression", nm.c_str(),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	266 err, erroffset);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	267 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	268 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	269
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	270 int subpatterns;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	271 int namecount;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	272 int nameentrysize;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	273 char *nametable;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	274 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	275
7520 b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	276 pcre_fullinfo(re, 0, PCRE_INFO_CAPTURECOUNT, &subpatterns);
b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	277 pcre_fullinfo(re, 0, PCRE_INFO_NAMECOUNT, &namecount);
b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	278 pcre_fullinfo(re, 0, PCRE_INFO_NAMEENTRYSIZE, &nameentrysize);
b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	279 pcre_fullinfo(re, 0, PCRE_INFO_NAMETABLE, &nametable);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	280
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	281 OCTAVE_LOCAL_BUFFER(int, ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	282 OCTAVE_LOCAL_BUFFER(int, nidx, namecount);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	283
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	284 for (int i = 0; i < namecount; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	285 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	286 // Index of subpattern in first two bytes MSB first of name.
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	287 // Extract index.
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	288 nidx[i] = (static_cast<int>(nametable[i*nameentrysize])) << 8 \|
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	289 static_cast<int>(nametable[i*nameentrysize+1]);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	290 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	291
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	292 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	293 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	294 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	295
7520 b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	296 int matches = pcre_exec(re, 0, buffer.c_str(),
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	297 buffer.length(), idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	298 (idx ? PCRE_NOTBOL : 0),
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	299 ovector, (subpatterns+1)*3);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	300
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	301 if (matches < 0 && matches != PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	302 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	303 error ("%s: internal error calling pcre_exec", nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	304 pcre_free(re);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	305 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	306 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	307 else if (matches == PCRE_ERROR_NOMATCH)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	308 break;
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	309 else if (ovector[1] <= ovector[0])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	310 break;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	311 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	312 {
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	313 int pos_match = 0;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	314 Matrix te(matches-1,2);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	315 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	316 {
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	317 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	318 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	319 te(pos_match,0) = double (ovector[2*i]+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	320 te(pos_match++,1) = double (ovector[2*i+1]);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	321 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	322 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	323 te.resize(pos_match,2);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	324 s = double (ovector[0]+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	325 e = double (ovector[1]);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	326
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	327 const char **listptr;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	328 int status = pcre_get_substring_list(buffer.c_str(), ovector,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	329 matches, &listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	330
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	331 if (status == PCRE_ERROR_NOMEMORY) {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	332 error("%s: cannot allocate memory in pcre_get_substring_list",
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	333 nm.c_str());
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	334 pcre_free(re);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	335 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	336 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	337
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	338 Cell cell_t (dim_vector(1,pos_match));
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	339 pos_match = 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	340 for (int i = 1; i < matches; i++)
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	341 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	342 cell_t(pos_match++) = std::string(*(listptr+i));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	343
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	344 m = std::string(*listptr);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	345 t = cell_t;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	346
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	347 string_vector named_tokens(nnames);
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	348 if (namecount > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	349 for (int i = 1; i < matches; i++)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	350 {
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	351 if (ovector[2i] >= 0 && ovector[2i+1] > 0)
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	352 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	353 named_tokens(named_idx(i-1)) =
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	354 std::string(*(listptr+nidx[i-1]));
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	355 }
e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	356 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	357
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	358 pcre_free_substring_list(listptr);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	359
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	360 regexp_elem new_elem (named_tokens, t, m, te, s, e);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	361 lst.push_back (new_elem);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	362 idx = ovector[1];
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	363 sz++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	364
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	365 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	366 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	367
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	368 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	369 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	370
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	371 pcre_free(re);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	372 #else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	373 regex_t compiled;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	374 int err=regcomp(&compiled, pattern.c_str(), REG_EXTENDED \|
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	375 (case_insensitive ? REG_ICASE : 0));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	376 if (err)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	377 {
7520 b166043585a8 use 0 instead of NULL John W. Eaton <jwe@octave.org> parents: 7242 diff changeset	378 int len = regerror(err, &compiled, 0, 0);
5760 8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	379 OCTAVE_LOCAL_BUFFER (char, errmsg, len);
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	380 regerror(err, &compiled, errmsg, len);
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	381 error("%s: %s in pattern (%s)", nm.c_str(), errmsg,
8d7162924bd3 [project @ 2006-04-14 04:01:37 by jwe] jwe parents: 5620 diff changeset	382 pattern.c_str());
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	383 regfree(&compiled);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	384 return 0;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	385 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	386
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	387 int subexpr = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	388 int idx = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	389 for (unsigned int i=0; i < pattern.length(); i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	390 subexpr += ( pattern[i] == '(' ? 1 : 0 );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	391 OCTAVE_LOCAL_BUFFER (regmatch_t, match, subexpr );
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	392
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	393 while(true)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	394 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	395 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	396
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	397 if (regexec(&compiled, buffer.c_str() + idx, subexpr,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	398 match, (idx ? REG_NOTBOL : 0)) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	399 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	400 // Count actual matches
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	401 int matches = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	402 while (matches < subexpr && match[matches].rm_so >= 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	403 matches++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	404
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	405 s = double (match[0].rm_so+1+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	406 e = double (match[0].rm_eo+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	407 Matrix te(matches-1,2);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	408 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	409 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	410 te(i-1,0) = double (match[i].rm_so+1+idx);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	411 te(i-1,1) = double (match[i].rm_eo+idx);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	412 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	413
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	414 m = buffer.substr (match[0].rm_so+idx,
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	415 match[0].rm_eo-match[0].rm_so);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	416
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	417 Cell cell_t (dim_vector(1,matches-1));
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	418 for (int i = 1; i < matches; i++)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	419 cell_t(i-1) = buffer.substr (match[i].rm_so+idx,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	420 match[i].rm_eo-match[i].rm_so);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	421 t = cell_t;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	422
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	423 idx += match[0].rm_eo;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	424
5866 f9ac7ebf0e19 [project @ 2006-06-28 16:05:22 by jwe] jwe parents: 5823 diff changeset	425 string_vector sv;
f9ac7ebf0e19 [project @ 2006-06-28 16:05:22 by jwe] jwe parents: 5823 diff changeset	426 regexp_elem new_elem (sv, t, m, te, s, e);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	427 lst.push_back (new_elem);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	428 sz++;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	429
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	430 if (once)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	431 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	432 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	433 else
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	434 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	435 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	436 regfree(&compiled);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	437 #endif
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	438 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	439 #else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	440 error ("%s: not available in this version of Octave", nm.c_str());
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	441 #endif
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	442 return sz;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	443 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	444
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	445 static octave_value_list
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	446 octregexp (const octave_value_list &args, int nargout, const std::string &nm,
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	447 bool case_insensitive)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	448 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	449 octave_value_list retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	450 int nargin = args.length();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	451 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	452 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	453 int nopts;
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	454 bool once;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	455 int sz = octregexp_list (args, nm, case_insensitive, lst, named, nopts, once);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	456
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	457 if (! error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	458 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	459 // Converted the linked list in the correct form for the return values
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	460
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	461 octave_idx_type i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	462 #ifdef HAVE_PCRE
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	463 Octave_map nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	464 if (sz == 1)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	465 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	466 for (int j = 0; j < named.length(); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	467 nmap.assign (named(j), lst.begin()->named_token(j));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	468 retval(5) = nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	469 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	470 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	471 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	472 for (int j = 0; j < named.length (); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	473 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	474 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	475 Cell tmp(dim_vector (1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	476 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	477 tmp(i++) = p->named_token(j);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	478 nmap.assign (named(j), octave_value (tmp));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	479 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	480 retval(5) = nmap;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	481 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	482 #else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	483 retval(5) = Octave_map();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	484 #endif
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	485
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	486 if (once)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	487 retval(4) = sz ? lst.front ().t : Cell();
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	488 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	489 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	490 Cell t (dim_vector(1, sz));
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	491 i = 0;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	492 for (const_iterator p = lst.begin(); p != lst.end(); p++)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	493 t(i++) = p->t;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	494 retval(4) = t;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	495 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	496
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	497 if (once)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	498 retval(3) = sz ? lst.front ().m : std::string();
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	499 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	500 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	501 Cell m (dim_vector(1, sz));
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	502 i = 0;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	503 for (const_iterator p = lst.begin(); p != lst.end(); p++)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	504 m(i++) = p->m;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	505 retval(3) = m;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	506 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	507
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	508 if (once)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	509 retval(2) = sz ? lst.front ().te : Matrix();
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	510 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	511 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	512 Cell te (dim_vector(1, sz));
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	513 i = 0;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	514 for (const_iterator p = lst.begin(); p != lst.end(); p++)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	515 te(i++) = p->te;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	516 retval(2) = te;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	517 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	518
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	519 if (once)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	520 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	521 if (sz)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	522 retval(1) = lst.front ().e;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	523 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	524 retval(1) = Matrix();
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	525 }
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	526 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	527 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	528 NDArray e (dim_vector(1, sz));
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	529 i = 0;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	530 for (const_iterator p = lst.begin(); p != lst.end(); p++)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	531 e(i++) = p->e;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	532 retval(1) = e;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	533 }
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	534
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	535 if (once)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	536 {
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	537 if (sz)
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	538 retval(0) = lst.front ().s;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	539 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	540 retval(0) = Matrix();
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	541 }
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	542 else
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	543 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	544 NDArray s (dim_vector(1, sz));
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	545 i = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	546 for (const_iterator p = lst.begin(); p != lst.end(); p++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	547 s(i++) = p->s;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	548 retval(0) = s;
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	549 }
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	550
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	551 // Alter the order of the output arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	552 if (nopts > 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	553 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	554 int n = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	555 octave_value_list new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	556 new_retval.resize(nargout);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	557
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	558 OCTAVE_LOCAL_BUFFER (int, arg_used, 6);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	559 for (int j = 0; j < 6; j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	560 arg_used[j] = false;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	561
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	562 for (int j = 2; j < nargin; j++)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	563 {
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	564 int k = 0;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	565 std::string str = args(j).string_value();
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	566 std::transform (str.begin (), str.end (), str.begin (), tolower);
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	567 if (str.find("once", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	568 \|\| str.find("stringanchors", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	569 \|\| str.find("lineanchors", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	570 \|\| str.find("matchcase", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	571 \|\| str.find("ignorecase", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	572 \|\| str.find("dotall", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	573 \|\| str.find("dotexceptnewline", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	574 \|\| str.find("literalspacing", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	575 \|\| str.find("freespacing", 0) == 0
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	576 )
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	577 continue;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	578 else if (str.find("start", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	579 k = 0;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	580 else if (str.find("end", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	581 k = 1;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	582 else if (str.find("tokenextents", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	583 k = 2;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	584 else if (str.find("match", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	585 k = 3;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	586 else if (str.find("tokens", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	587 k = 4;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	588 else if (str.find("names", 0) == 0)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	589 k = 5;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	590
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	591 new_retval(n++) = retval(k);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	592 arg_used[k] = true;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	593
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	594 if (n == nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	595 break;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	596 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	597
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	598 // Fill in the rest of the arguments
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	599 if (n < nargout)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	600 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	601 for (int j = 0; j < 6; j++)
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	602 {
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	603 if (! arg_used[j])
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	604 new_retval(n++) = retval(j);
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	605 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	606 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	607
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	608 retval = new_retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	609 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	610 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	611
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	612 return retval;
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	613 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	614
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	615 static octave_value_list
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	616 octcellregexp (const octave_value_list &args, int nargout, const std::string &nm,
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	617 bool case_insensitive)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	618 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	619 octave_value_list retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	620
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	621 if (args(0).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	622 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	623 OCTAVE_LOCAL_BUFFER (Cell, newretval, nargout);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	624 octave_value_list new_args = args;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	625 Cell cellstr = args(0).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	626 if (args(1).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	627 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	628 Cell cellpat = args(1).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	629
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	630 if (cellpat.numel() == 1)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	631 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	632 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	633 newretval[j].resize(cellstr.dims());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	634
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	635 new_args(1) = cellpat(0);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	636
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	637 for (octave_idx_type i = 0; i < cellstr.numel (); i++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	638 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	639 new_args(0) = cellstr(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	640 octave_value_list tmp = octregexp (new_args, nargout, nm,
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	641 case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	642
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	643 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	644 break;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	645
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	646 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	647 newretval[j](i) = tmp(j);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	648 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	649 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	650 else if (cellstr.numel() == 1)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	651 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	652 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	653 newretval[j].resize(cellpat.dims());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	654
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	655 new_args(0) = cellstr(0);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	656
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	657 for (octave_idx_type i = 0; i < cellpat.numel (); i++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	658 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	659 new_args(1) = cellpat(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	660 octave_value_list tmp = octregexp (new_args, nargout, nm,
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	661 case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	662
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	663 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	664 break;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	665
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	666 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	667 newretval[j](i) = tmp(j);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	668 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	669 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	670 else if (cellstr.numel() == cellpat.numel())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	671 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	672
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	673 if (cellstr.dims() != cellpat.dims())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	674 error ("%s: Inconsistent cell array dimensions", nm.c_str());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	675 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	676 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	677 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	678 newretval[j].resize(cellstr.dims());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	679
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	680 for (octave_idx_type i = 0; i < cellstr.numel (); i++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	681 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	682 new_args(0) = cellstr(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	683 new_args(1) = cellpat(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	684
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	685 octave_value_list tmp = octregexp (new_args, nargout, nm,
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	686 case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	687
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	688 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	689 break;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	690
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	691 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	692 newretval[j](i) = tmp(j);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	693 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	694 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	695 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	696 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	697 error ("regexp: cell array arguments must be scalar or equal size");
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	698 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	699 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	700 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	701 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	702 newretval[j].resize(cellstr.dims());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	703
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	704 for (octave_idx_type i = 0; i < cellstr.numel (); i++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	705 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	706 new_args(0) = cellstr(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	707 octave_value_list tmp = octregexp (new_args, nargout, nm, case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	708
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	709 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	710 break;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	711
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	712 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	713 newretval[j](i) = tmp(j);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	714 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	715 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	716
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	717 if (!error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	718 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	719 retval(j) = octave_value (newretval[j]);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	720 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	721 else if (args(1).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	722 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	723 OCTAVE_LOCAL_BUFFER (Cell, newretval, nargout);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	724 octave_value_list new_args = args;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	725 Cell cellpat = args(1).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	726
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	727 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	728 newretval[j].resize(cellpat.dims());
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	729
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	730 for (octave_idx_type i = 0; i < cellpat.numel (); i++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	731 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	732 new_args(1) = cellpat(i);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	733 octave_value_list tmp = octregexp (new_args, nargout, nm, case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	734
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	735 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	736 break;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	737
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	738 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	739 newretval[j](i) = tmp(j);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	740 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	741
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	742 if (!error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	743 for (int j = 0; j < nargout; j++)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	744 retval(j) = octave_value (newretval[j]);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	745 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	746 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	747 retval = octregexp (args, nargout, nm, case_insensitive);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	748
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	749 return retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	750
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	751 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	752
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	753 DEFUN_DLD (regexp, args, nargout,
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	754 "-- texinfo --\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	755 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexp (@var{str}, @var{pat})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	756 @deftypefnx {Loadable Function} {[@dots{}] =} regexp (@var{str}, @var{pat}, @var{opts}, @dots{})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	757 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	758 Regular expression string matching. Matches @var{pat} in @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	759 returns the position and matching substrings or empty values if there are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	760 none.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	761 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	762 The matched pattern @var{pat} can include any of the standard regex\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	763 operators, including:\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	764 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	765 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	766 @item .\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	767 Match any character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	768 @item * + ? @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	769 Repetition operators, representing\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	770 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	771 @item *\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	772 Match zero or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	773 @item +\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	774 Match one or more times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	775 @item ?\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	776 Match zero or one times\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	777 @item @{@}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	778 Match range operator, which is of the form @code{@{@var{n}@}} to match exactly\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	779 @var{n} times, @code{@{@var{m},@}} to match @var{m} or more times,\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	780 @code{@{@var{m},@var{n}@}} to match between @var{m} and @var{n} times.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	781 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	782 @item [@dots{}] [^@dots{}]\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	783 List operators, where for example @code{[ab]c} matches @code{ac} and @code{bc}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	784 @item ()\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	785 Grouping operator\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	786 @item \|\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	787 Alternation operator. Match one of a choice of regular expressions. The\n\
7001 8b0cfeb06365 [project @ 2007-10-10 18:02:59 by jwe] jwe parents: 6678 diff changeset	788 alternatives must be delimited by the grouping operator @code{()} above\n\
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	789 @item ^ $\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	790 Anchoring operator. @code{^} matches the start of the string @var{str} and\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	791 @code{$} the end\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	792 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	793 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	794 In addition the following escaped characters have special meaning. It should\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	795 be noted that it is recommended to quote @var{pat} in single quotes rather\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	796 than double quotes, to avoid the escape sequences being interpreted by octave\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	797 before being passed to @code{regexp}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	798 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	799 @table @code\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	800 @item \\b\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	801 Match a word boundary\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	802 @item \\B\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	803 Match within a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	804 @item \\w\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	805 Matches any word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	806 @item \\W\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	807 Matches any non word character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	808 @item \\<\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	809 Matches the beginning of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	810 @item \\>\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	811 Matches the end of a word\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	812 @item \\s\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	813 Matches any whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	814 @item \\S\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	815 Matches any non whitespace character\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	816 @item \\d\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	817 Matches any digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	818 @item \\D\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	819 Matches any non-digit\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	820 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	821 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	822 The outputs of @code{regexp} by default are in the order as given below\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	823 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	824 @table @asis\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	825 @item @var{s}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	826 The start indices of each of the matching substrings\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	827 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	828 @item @var{e}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	829 The end indices of each matching substring\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	830 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	831 @item @var{te}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	832 The extents of each of the matched token surrounded by @code{(@dots{})} in\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	833 @var{pat}.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	834 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	835 @item @var{m}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	836 A cell array of the text of each match.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	837 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	838 @item @var{t}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	839 A cell array of the text of each token matched.\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	840 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	841 @item @var{nm}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	842 A structure containing the text of each matched named token, with the name\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	843 being used as the fieldname. A named token is denoted as\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	844 @code{(?<name>@dots{})}\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	845 @end table\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	846 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	847 Particular output arguments or the order of the output arguments can be\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	848 selected by additional @var{opts} arguments. These are strings and the\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	849 correspondence between the output arguments and the optional argument\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	850 are\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	851 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	852 @multitable @columnfractions 0.2 0.3 0.3 0.2\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	853 @item @tab 'start' @tab @var{s} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	854 @item @tab 'end' @tab @var{e} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	855 @item @tab 'tokenExtents' @tab @var{te} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	856 @item @tab 'match' @tab @var{m} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	857 @item @tab 'tokens' @tab @var{t} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	858 @item @tab 'names' @tab @var{nm} @tab\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	859 @end multitable\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	860 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	861 A further optional argument is 'once', that limits the number of returned\n\
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	862 matches to the first match. Additional arguments are\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	863 \n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	864 @table @asis\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	865 @item matchcase\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	866 Make the matching case sensitive.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	867 @item ignorecase\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	868 Make the matching case insensitive.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	869 @item stringanchors\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	870 Match the anchor characters at the beginning and end of the string.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	871 @item lineanchors\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	872 Match the anchor characters at the beginning and end of the line.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	873 @item dotall\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	874 The character @code{.} matches the newline character.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	875 @item dotexceptnewline\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	876 The character @code{.} matches all but the newline character.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	877 @item freespacing\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	878 The pattern can include arbitrary whitespace and comments starting with\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	879 @code{#}.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	880 @item literalspacing\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	881 The pattern is taken literally.\n\
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	882 @end table\n\
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	883 @end deftypefn")
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	884 {
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	885 octave_value_list retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	886 int nargin = args.length();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	887
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	888 if (nargin < 2)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	889 print_usage ();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	890 else if (args(0).is_cell() \|\| args(1).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	891 retval = octcellregexp (args, nargout, "regexp", false);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	892 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	893 retval = octregexp (args, nargout, "regexp", false);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	894
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	895 return retval;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	896 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	897
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	898 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	899
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	900 ## seg-fault test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	901 %!assert(regexp("abcde","."),[1,2,3,4,5])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	902
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	903 ## Check that anchoring of pattern works correctly
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	904 %!assert(regexp('abcabc','^abc'),1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	905 %!assert(regexp('abcabc','abc$'),4);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	906 %!assert(regexp('abcabc','^abc$'),zeros(1,0));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	907
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	908 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	909 %! [s, e, te, m, t] = regexp(' No Match ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	910 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	911 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	912 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	913 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	914 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	915
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	916 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	917 %! [s, e, te, m, t] = regexp(' FiRetrUck ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	918 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	919 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	920 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	921 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	922 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	923
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	924 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	925 %! [s, e, te, m, t] = regexp(' firetruck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	926 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	927 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	928 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	929 %! assert (m{1}, 'firetruck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	930 %! assert (t{1}{1}, 'iretr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	931
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	932 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	933 %! [s, e, te, m, t] = regexp('short test string','\wr\w');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	934 %! assert (s,[1,12])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	935 %! assert (e,[5,17])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	936 %! assert (size(te), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	937 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	938 %! assert (isempty(te{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	939 %! assert (m{1},'short')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	940 %! assert (m{2},'string')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	941 %! assert (size(t), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	942 %! assert (isempty(t{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	943 %! assert (isempty(t{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	944
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	945 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	946 %! [s, e, te, m, t] = regexp('short test string','\wr\w','once');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	947 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	948 %! assert (e,5)
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	949 %! assert (isempty(te))
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	950 %! assert (m,'short')
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	951 %! assert (isempty(t))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	952
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	953 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	954 %! [m, te, e, s, t] = regexp('short test string','\wr\w','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	955 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	956 %! assert (e,5)
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	957 %! assert (isempty(te))
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	958 %! assert (m,'short')
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	959 %! assert (isempty(t))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	960
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	961 %!testif HAVE_PCRE
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	962 %! ## This test is expected to fail if PCRE is not installed
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	963 %! [s, e, te, m, t, nm] = regexp('short test string','(?<word1>\wt)\s(?<word2>\w*t)');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	964 %! assert (s,1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	965 %! assert (e,10)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	966 %! assert (size(te), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	967 %! assert (te{1}, [1 5; 7, 10])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	968 %! assert (m{1},'short test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	969 %! assert (size(t),[1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	970 %! assert (t{1}{1},'short')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	971 %! assert (t{1}{2},'test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	972 %! assert (size(nm), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	973 %! assert (!isempty(fieldnames(nm)))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	974 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	975 %! assert (nm.word1,'short')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	976 %! assert (nm.word2,'test')
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	977
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	978 %!testif HAVE_PCRE
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	979 %! ## This test is expected to fail if PCRE is not installed
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	980 %! [nm, m, te, e, s, t] = regexp('short test string','(?<word1>\wt)\s(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	981 %! assert (s,1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	982 %! assert (e,10)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	983 %! assert (size(te), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	984 %! assert (te{1}, [1 5; 7, 10])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	985 %! assert (m{1},'short test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	986 %! assert (size(t),[1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	987 %! assert (t{1}{1},'short')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	988 %! assert (t{1}{2},'test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	989 %! assert (size(nm), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	990 %! assert (!isempty(fieldnames(nm)))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	991 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	992 %! assert (nm.word1,'short')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	993 %! assert (nm.word2,'test')
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	994
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	995 %!testif HAVE_PCRE
5619 e9112ff172b1 [project @ 2006-02-13 20:05:36 by dbateman] dbateman parents: 5582 diff changeset	996 %! ## This test is expected to fail if PCRE is not installed
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	997 %! [t, nm] = regexp("John Davis\nRogers, James",'(?<first>\w+)\s+(?<last>\w+)\|(?<last>\w+),\s+(?<first>\w+)','tokens','names');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	998 %! assert (size(t), [1,2]);
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	999 %! assert (t{1}{1},'John');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1000 %! assert (t{1}{2},'Davis');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1001 %! assert (t{2}{1},'Rogers');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1002 %! assert (t{2}{2},'James');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1003 %! assert (size(nm), [1,1]);
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1004 %! assert (nm.first{1},'John');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1005 %! assert (nm.first{2},'James');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1006 %! assert (nm.last{1},'Davis');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1007 %! assert (nm.last{2},'Rogers');
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1008
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1009 %!assert(regexp("abc\nabc",'.'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1010 %!assert(regexp("abc\nabc",'.','dotall'),[1:7])
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1011 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1012 %! assert(regexp("abc\nabc",'(?s).'),[1:7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1013 %! assert(regexp("abc\nabc",'.','dotexceptnewline'),[1,2,3,5,6,7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1014 %! assert(regexp("abc\nabc",'(?-s).'),[1,2,3,5,6,7])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1015
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1016 %!assert(regexp("caseCaSe",'case'),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1017 %!assert(regexp("caseCaSe",'case',"matchcase"),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1018 %!assert(regexp("caseCaSe",'case',"ignorecase"),[1,5])
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1019 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1020 %! assert(regexp("caseCaSe",'(?-i)case'),1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1021 %! assert(regexp("caseCaSe",'(?i)case'),[1,5])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1022
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1023 %!assert (regexp("abc\nabc",'c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1024 %!assert (regexp("abc\nabc",'c$',"stringanchors"),7)
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1025 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1026 %! assert (regexp("abc\nabc",'(?-m)c$'),7)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1027 %! assert (regexp("abc\nabc",'c$',"lineanchors"),[3,7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1028 %! assert (regexp("abc\nabc",'(?m)c$'),[3,7])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1029
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1030 %!assert (regexp("this word",'s w'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1031 %!assert (regexp("this word",'s w','literalspacing'),4)
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1032 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1033 %! assert (regexp("this word",'(?-x)s w','literalspacing'),4)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1034 %! assert (regexp("this word",'s w','freespacing'),zeros(1,0))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1035 %! assert (regexp("this word",'(?x)s w'),zeros(1,0))
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1036
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1037 %!error regexp('string', 'tri', 'BadArg');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1038 %!error regexp('string');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1039
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1040 %!assert(regexp({'asdfg-dfd';'-dfd-dfd-';'qasfdfdaq'},'-'),{6;[1,5,9];zeros(1,0)})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1041 %!assert(regexp({'asdfg-dfd','-dfd-dfd-','qasfdfdaq'},'-'),{6,[1,5,9],zeros(1,0)})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1042 %!assert(regexp({'asdfg-dfd';'-dfd-dfd-';'qasfdfdaq'},{'-';'f';'q'}),{6;[3,7];[1,9]})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1043 %!assert(regexp('Strings',{'t','s'}),{2,7})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1044
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1045 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1046
6549 5a5a09d7deb8 [project @ 2007-04-20 06:55:29 by jwe] jwe parents: 6547 diff changeset	1047 DEFUN_DLD (regexpi, args, nargout,
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1048 "-- texinfo --\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1049 @deftypefn {Loadable Function} {[@var{s}, @var{e}, @var{te}, @var{m}, @var{t}, @var{nm}] =} regexpi (@var{str}, @var{pat})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1050 @deftypefnx {Loadable Function} {[@dots{}] =} regexpi (@var{str}, @var{pat}, @var{opts}, @dots{})\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1051 \n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1052 Case insensitive regular expression string matching. Matches @var{pat} in\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1053 @var{str} and returns the position and matching substrings or empty values\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1054 if there are none. See @code{regexp} for more details\n\
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1055 @end deftypefn")
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1056 {
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1057 octave_value_list retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1058 int nargin = args.length();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1059
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1060 if (nargin < 2)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1061 print_usage ();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1062 else if (args(0).is_cell() \|\| args(1).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1063 retval = octcellregexp (args, nargout, "regexpi", true);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1064 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1065 retval = octregexp (args, nargout, "regexpi", true);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1066
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1067 return retval;
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1068 }
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1069
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1070 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1071
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1072 ## seg-fault test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1073 %!assert(regexpi("abcde","."),[1,2,3,4,5])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1074
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1075 ## Check that anchoring of pattern works correctly
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1076 %!assert(regexpi('abcabc','^abc'),1);
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1077 %!assert(regexpi('abcabc','abc$'),4);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1078 %!assert(regexpi('abcabc','^abc$'),zeros(1,0));
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1079
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1080 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1081 %! [s, e, te, m, t] = regexpi(' No Match ', 'f(.*)uck');
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1082 %! assert (s,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1083 %! assert (e,zeros(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1084 %! assert (te,cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1085 %! assert (m, cell(1,0))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1086 %! assert (t, cell(1,0))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1087
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1088 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1089 %! [s, e, te, m, t] = regexpi(' FiRetrUck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1090 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1091 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1092 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1093 %! assert (m{1}, 'FiRetrUck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1094 %! assert (t{1}{1}, 'iRetr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1095
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1096 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1097 %! [s, e, te, m, t] = regexpi(' firetruck ', 'f(.*)uck');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1098 %! assert (s,2)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1099 %! assert (e,10)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1100 %! assert (te{1},[3,7])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1101 %! assert (m{1}, 'firetruck')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1102 %! assert (t{1}{1}, 'iretr')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1103
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1104 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1105 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\wr\w');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1106 %! assert (s,[1,12])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1107 %! assert (e,[5,17])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1108 %! assert (size(te), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1109 %! assert (isempty(te{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1110 %! assert (isempty(te{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1111 %! assert (m{1},'ShoRt')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1112 %! assert (m{2},'String')
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1113 %! assert (size(t), [1,2])
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1114 %! assert (isempty(t{1}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1115 %! assert (isempty(t{2}))
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1116
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1117 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1118 %! [s, e, te, m, t] = regexpi('ShoRt Test String','\wr\w','once');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1119 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1120 %! assert (e,5)
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1121 %! assert (isempty(te))
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1122 %! assert (m,'ShoRt')
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1123 %! assert (isempty(t))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1124
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1125 %!test
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1126 %! [m, te, e, s, t] = regexpi('ShoRt Test String','\wr\w','once', 'match', 'tokenExtents', 'end', 'start', 'tokens');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1127 %! assert (s,1)
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1128 %! assert (e,5)
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1129 %! assert (isempty(te))
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1130 %! assert (m,'ShoRt')
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1131 %! assert (isempty(t))
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1132
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1133 %!testif HAVE_PCRE
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1134 %! ## This test is expected to fail if PCRE is not installed
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1135 %! [s, e, te, m, t, nm] = regexpi('ShoRt Test String','(?<word1>\wt)\s(?<word2>\w*t)');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1136 %! assert (s,1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1137 %! assert (e,10)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1138 %! assert (size(te), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1139 %! assert (te{1}, [1 5; 7, 10])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1140 %! assert (m{1},'ShoRt Test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1141 %! assert (size(t),[1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1142 %! assert (t{1}{1},'ShoRt')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1143 %! assert (t{1}{2},'Test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1144 %! assert (size(nm), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1145 %! assert (!isempty(fieldnames(nm)))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1146 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1147 %! assert (nm.word1,'ShoRt')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1148 %! assert (nm.word2,'Test')
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1149
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1150 %!testif HAVE_PCRE
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1151 %! ## This test is expected to fail if PCRE is not installed
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1152 %! [nm, m, te, e, s, t] = regexpi('ShoRt Test String','(?<word1>\wt)\s(?<word2>\w*t)', 'names', 'match', 'tokenExtents', 'end', 'start', 'tokens');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1153 %! assert (s,1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1154 %! assert (e,10)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1155 %! assert (size(te), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1156 %! assert (te{1}, [1 5; 7, 10])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1157 %! assert (m{1},'ShoRt Test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1158 %! assert (size(t),[1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1159 %! assert (t{1}{1},'ShoRt')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1160 %! assert (t{1}{2},'Test')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1161 %! assert (size(nm), [1,1])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1162 %! assert (!isempty(fieldnames(nm)))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1163 %! assert (sort(fieldnames(nm)),{'word1';'word2'})
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1164 %! assert (nm.word1,'ShoRt')
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1165 %! assert (nm.word2,'Test')
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1166
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1167 %!assert(regexpi("abc\nabc",'.'),[1:7])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1168 %!assert(regexpi("abc\nabc",'.','dotall'),[1:7])
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1169 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1170 %! assert(regexpi("abc\nabc",'(?s).'),[1:7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1171 %! assert(regexpi("abc\nabc",'.','dotexceptnewline'),[1,2,3,5,6,7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1172 %! assert(regexpi("abc\nabc",'(?-s).'),[1,2,3,5,6,7])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1173
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1174 %!assert(regexpi("caseCaSe",'case'),[1,5])
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1175 %!assert(regexpi("caseCaSe",'case',"matchcase"),1)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1176 %!assert(regexpi("caseCaSe",'case',"ignorecase"),[1,5])
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1177 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1178 %! assert(regexpi("caseCaSe",'(?-i)case'),1)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1179 %! assert(regexpi("caseCaSe",'(?i)case'),[1,5])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1180
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1181 %!assert (regexpi("abc\nabc",'c$'),7)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1182 %!assert (regexpi("abc\nabc",'c$',"stringanchors"),7)
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1183 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1184 %! assert (regexpi("abc\nabc",'(?-m)c$'),7)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1185 %! assert (regexpi("abc\nabc",'c$',"lineanchors"),[3,7])
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1186 %! assert (regexpi("abc\nabc",'(?m)c$'),[3,7])
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1187
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1188 %!assert (regexpi("this word",'s w'),4)
12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1189 %!assert (regexpi("this word",'s w','literalspacing'),4)
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1190 %!testif HAVE_PCRE
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1191 %! assert (regexpi("this word",'(?-x)s w','literalspacing'),4)
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1192 %! assert (regexpi("this word",'s w','freespacing'),zeros(1,0))
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1193 %! assert (regexpi("this word",'(?x)s w'),zeros(1,0))
5779 12eeebfa7ead [project @ 2006-04-27 19:30:14 by dbateman] dbateman parents: 5775 diff changeset	1194
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1195 %!error regexpi('string', 'tri', 'BadArg');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1196 %!error regexpi('string');
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1197
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1198 %!assert(regexpi({'asdfg-dfd';'-dfd-dfd-';'qasfdfdaq'},'-'),{6;[1,5,9];zeros(1,0)})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1199 %!assert(regexpi({'asdfg-dfd','-dfd-dfd-','qasfdfdaq'},'-'),{6,[1,5,9],zeros(1,0)})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1200 %!assert(regexpi({'asdfg-dfd';'-dfd-dfd-';'qasfdfdaq'},{'-';'f';'q'}),{6;[3,7];[1,9]})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1201 %!assert(regexpi('Strings',{'t','s'}),{2,[1,7]})
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1202
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1203 */
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1204
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1205
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1206 static octave_value
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1207 octregexprep (const octave_value_list &args, const std::string &nm)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1208 {
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1209 octave_value retval;
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1210 int nargin = args.length();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1211
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1212 // Make sure we have string,pattern,replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1213 const std::string buffer = args(0).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1214 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1215 const std::string pattern = args(1).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1216 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1217 const std::string replacement = args(2).string_value ();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1218 if (error_state) return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1219
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1220 // Pack options excluding 'tokenize' and various output
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1221 // reordering strings into regexp arg list
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1222 octave_value_list regexpargs(nargin-1,octave_value());
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1223 regexpargs(0) = args(0);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1224 regexpargs(1) = args(1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1225 int len=2;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1226 for (int i = 3; i < nargin; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1227 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1228 const std::string opt = args(i).string_value();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1229 if (opt != "tokenize" && opt != "start" && opt != "end"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1230 && opt != "tokenextents" && opt != "match" && opt != "tokens"
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1231 && opt != "names" && opt != "warnings")
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1232 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1233 regexpargs(len++) = args(i);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1234 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1235 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1236 regexpargs.resize(len);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1237
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1238 // Identify replacement tokens; build a vector of group numbers in
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1239 // the replacement string so that we can quickly calculate the size
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1240 // of the replacement.
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1241 int tokens = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1242 for (size_t i=1; i < replacement.size(); i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1243 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1244 if (replacement[i-1]=='$' && isdigit(replacement[i]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1245 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1246 tokens++, i++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1247 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1248 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1249 std::vector<int> token(tokens);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1250 int kk = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1251 for (size_t i = 1; i < replacement.size(); i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1252 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1253 if (replacement[i-1]=='$' && isdigit(replacement[i]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1254 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1255 token[kk++] = replacement[i]-'0';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1256 i++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1257 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1258 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1259
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1260 // Perform replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1261 std::string rep;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1262 if (tokens > 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1263 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1264 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1265 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1266 int nopts;
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1267 bool once;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1268 int sz = octregexp_list (regexpargs, nm , false, lst, named, nopts, once);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1269
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1270 if (error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1271 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1272 if (sz == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1273 {
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1274 retval = args(0);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1275 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1276 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1277
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1278 // Determine replacement length
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1279 const size_t replen = replacement.size() - 2*tokens;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1280 int delta = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1281 const_iterator p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1282 for (int i = 0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1283 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1284 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1285
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1286 const Matrix pairs(p->te);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1287 size_t pairlen = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1288 for (int j = 0; j < tokens; j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1289 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1290 if (token[j] == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1291 pairlen += static_cast<size_t>(p->e - p->s) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1292 else if (token[j] <= pairs.rows())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1293 pairlen += static_cast<size_t>(pairs(token[j]-1,1) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1294 pairs(token[j]-1,0)) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1295 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1296 delta += static_cast<int>(replen + pairlen) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1297 static_cast<int>(p->e - p->s + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1298 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1299 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1300
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1301 // Build replacement string
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1302 rep.reserve(buffer.size()+delta);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1303 size_t from = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1304 p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1305 for (int i=0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1306 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1307 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1308
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1309 const Matrix pairs(p->te);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1310 rep.append(&buffer[from], static_cast<size_t>(p->s - 1) - from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1311 from = static_cast<size_t>(p->e - 1) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1312 for (size_t j = 1; j < replacement.size(); j++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1313 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1314 if (replacement[j-1]=='$' && isdigit(replacement[j]))
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1315 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1316 int k = replacement[j]-'0';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1317 if (k == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1318 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1319 // replace with entire match
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1320 rep.append(&buffer[static_cast<size_t>(p->e - 1)],
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1321 static_cast<size_t>(p->e - p->s) + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1322 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1323 else if (k <= pairs.rows())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1324 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1325 // replace with group capture
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1326 rep.append(&buffer[static_cast<size_t>(pairs(k-1,0)-1)],
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1327 static_cast<size_t>(pairs(k-1,1) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1328 pairs(k-1,0))+1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1329 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1330 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1331 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1332 // replace with nothing
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1333 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1334 j++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1335 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1336 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1337 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1338 rep.append(1,replacement[j-1]);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1339 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1340 if (j+1 == replacement.size())
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1341 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1342 rep.append(1,replacement[j]);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1343 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1344 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1345 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1346 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1347 rep.append(&buffer[from],buffer.size()-from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1348 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1349 else
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1350 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1351 std::list<regexp_elem> lst;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1352 string_vector named;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1353 int nopts;
7893 eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1354 bool once;
eb9ccb44ea41 make regexp(...,'once') matlab compatible Jaroslav Hajek <highegg@gmail.com> parents: 7520 diff changeset	1355 int sz = octregexp_list (regexpargs, nm, false, lst, named, nopts, once);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1356
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1357 if (error_state)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1358 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1359 if (sz == 0)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1360 {
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1361 retval = args(0);
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1362 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1363 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1364
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1365 // Determine replacement length
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1366 const size_t replen = replacement.size();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1367 int delta = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1368 const_iterator p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1369 for (int i = 0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1370 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1371 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1372 delta += static_cast<int>(replen) -
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1373 static_cast<int>(p->e - p->s + 1);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1374 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1375 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1376
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1377 // Build replacement string
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1378 rep.reserve(buffer.size()+delta);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1379 size_t from = 0;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1380 p = lst.begin();
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1381 for (int i=0; i < sz; i++)
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1382 {
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1383 OCTAVE_QUIT;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1384 rep.append(&buffer[from], static_cast<size_t>(p->s - 1) - from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1385 from = static_cast<size_t>(p->e - 1) + 1;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1386 rep.append(replacement);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1387 p++;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1388 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1389 rep.append(&buffer[from],buffer.size()-from);
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1390 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1391
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1392 retval = rep;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1393 return retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1394 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1395
6549 5a5a09d7deb8 [project @ 2007-04-20 06:55:29 by jwe] jwe parents: 6547 diff changeset	1396 DEFUN_DLD (regexprep, args, ,
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1397 "-- texinfo --\n\
6678 49724abe1236 [project @ 2007-05-31 19:44:45 by jwe] jwe parents: 6549 diff changeset	1398 @deftypefn {Loadable Function} {@var{string} =} regexprep (@var{string}, @var{pat}, @var{repstr}, @var{options})\n\
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1399 Replace matches of @var{pat} in @var{string} with @var{repstr}.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1400 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1401 \n\
7007 6304d9ea0a30 [project @ 2007-10-11 16:26:36 by jwe] jwe parents: 7001 diff changeset	1402 The replacement can contain @code{$i}, which substitutes\n\
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1403 for the ith set of parentheses in the match string. E.g.,\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1404 @example\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1405 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1406 regexprep(\"Bill Dunn\",'(\\w+) (\\w+)','$2, $1')\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1407 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1408 @end example\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1409 returns \"Dunn, Bill\"\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1410 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1411 @var{options} may be zero or more of\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1412 @table @samp\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1413 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1414 @item once\n\
7001 8b0cfeb06365 [project @ 2007-10-10 18:02:59 by jwe] jwe parents: 6678 diff changeset	1415 Replace only the first occurrence of @var{pat} in the result.\n\
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1416 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1417 @item warnings\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1418 This option is present for compatibility but is ignored.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1419 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1420 @item ignorecase or matchcase\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1421 Ignore case for the pattern matching (see @code{regexpi}).\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1422 Alternatively, use (?i) or (?-i) in the pattern.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1423 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1424 @item lineanchors and stringanchors\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1425 Whether characters ^ and $ match the beginning and ending of lines.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1426 Alternatively, use (?m) or (?-m) in the pattern.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1427 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1428 @item dotexceptnewline and dotall\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1429 Whether . matches newlines in the string.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1430 Alternatively, use (?s) or (?-s) in the pattern.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1431 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1432 @item freespacing or literalspacing\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1433 Whether whitespace and # comments can be used to make the regular expression more readable.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1434 Alternatively, use (?x) or (?-x) in the pattern.\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1435 \n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1436 @end table\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1437 @seealso{regexp,regexpi}\n\
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1438 @end deftypefn")
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1439 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1440 octave_value_list retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1441 int nargin = args.length();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1442
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1443 if (nargin < 3)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1444 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1445 print_usage ();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1446 return retval;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1447 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1448
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1449 if (args(0).is_cell() \|\| args(1).is_cell() \|\| args(2).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1450 {
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1451 Cell str;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1452 Cell pat;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1453 Cell rep;
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1454 dim_vector dv0;
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1455 dim_vector dv1(1,1);
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1456
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1457 if (args(0).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1458 str = args(0).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1459 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1460 str = Cell (args(0));
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1461
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1462 if (args(1).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1463 pat = args(1).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1464 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1465 pat = Cell (args(1));
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1466
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1467 if (args(2).is_cell())
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1468 rep = args(2).cell_value();
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1469 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1470 rep = Cell (args(2));
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1471
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1472 dv0 = str.dims();
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1473 if (pat.numel() != 1)
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1474 {
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1475 dv1 = pat.dims();
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1476 if (rep.numel() != 1 && dv1 != rep.dims())
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1477 error ("regexprep: Inconsistent cell array dimensions");
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1478 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1479 else if (rep.numel() != 1)
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1480 dv1 = rep.dims();
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1481
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1482 if (!error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1483 {
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1484 Cell ret (dv0);
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1485 octave_value_list new_args = args;
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1486
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1487 for (octave_idx_type i = 0; i < dv0.numel(); i++)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1488 {
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1489 new_args(0) = str(i);
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1490 if (pat.numel() == 1)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1491 new_args(1) = pat(0);
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1492 if (rep.numel() == 1)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1493 new_args(2) = rep(0);
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1494 for (octave_idx_type j = 0; j < dv1.numel(); j++)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1495 {
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1496 if (pat.numel() != 1)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1497 new_args(1) = pat(j);
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1498 if (rep.numel() != 1)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1499 new_args(2) = rep(j);
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1500 new_args(0) = octregexprep (new_args, "regexprep");
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1501
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1502 if (error_state)
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1503 break;
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1504 }
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1505
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1506 if (error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1507 break;
6495 fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1508
fd09c7e8c4c9 [project @ 2007-04-05 16:18:20 by dbateman] dbateman parents: 6361 diff changeset	1509 ret(i) = new_args(0);
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1510 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1511
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1512 if (!error_state)
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1513 retval = octave_value (ret);
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1514 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1515 }
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1516 else
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1517 retval = octregexprep (args, "regexprep");
776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1518
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1519 return retval;
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1520 }
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1521
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1522 /*
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1523 %!test # Replace with empty
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1524 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1525 %! t = regexprep(xml,'<[!?][^>]*>','');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1526 %! assert(t,' <tag v="hello">some stuff</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1527
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1528 %!test # Replace with non-empty
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1529 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1530 %! t = regexprep(xml,'<[!?][^>]*>','?');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1531 %! assert(t,'? <tag v="hello">some stuff?</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1532
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1533 %!test # Check that 'tokenize' is ignored
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1534 %! xml = '<!-- This is some XML --> <tag v="hello">some stuff<!-- sample tag--></tag>';
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1535 %! t = regexprep(xml,'<[!?][^>]*>','','tokenize');
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1536 %! assert(t,' <tag v="hello">some stuff</tag>')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1537
7242 e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1538 %!testif HAVE_PCRE # Capture replacement
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1539 %! data = "Bob Smith\nDavid Hollerith\nSam Jenkins";
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1540 %! result = "Smith, Bob\nHollerith, David\nJenkins, Sam";
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1541 %! t = regexprep(data,'(?m)^(\w+)\s+(\w+)$','$2, $1');
e4398e3903be [project @ 2007-12-03 23:52:07 by dbateman] dbateman parents: 7237 diff changeset	1542 %! assert(t,result)
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1543
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1544 # Return the original if no match
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1545 %!assert(regexprep('hello','world','earth'),'hello')
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1546
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1547 ## Test a general replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1548 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Za-z0-9_]", "_"), "a_b_c_d_e_f_g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1549
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1550 ## Make sure it works at the beginning and end
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1551 %!assert(regexprep("a[b]c{d}e-f=g", "a", "_"), "_[b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1552 %!assert(regexprep("a[b]c{d}e-f=g", "g", "_"), "a[b]c{d}e-f=_");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1553
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1554 ## Options
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1555 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Za-z0-9_]", "_", "once"), "a_b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1556 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Z0-9_]", "_", "ignorecase"), "a_b_c_d_e_f_g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1557
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1558 ## Option combinations
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1559 %!assert(regexprep("a[b]c{d}e-f=g", "[^A-Z0-9_]", "_", "once", "ignorecase"), "a_b]c{d}e-f=g");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1560
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1561 ## End conditions on replacement
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1562 %!assert(regexprep("abc","(b)",".$1"),"a.bc");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1563 %!assert(regexprep("abc","(b)","$1"),"abc");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1564 %!assert(regexprep("abc","(b)","$1."),"ab.c");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1565 %!assert(regexprep("abc","(b)","$1.."),"ab..c");
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1566
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1567 ## Test cell array arguments
6503 a46d4161213f [project @ 2007-04-06 14:57:21 by jwe] jwe parents: 6495 diff changeset	1568 %!assert(regexprep("abc",{"b","a"},"?"),{"??c"})
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1569 %!assert(regexprep({"abc","cba"},"b","?"),{"a?c","c?a"})
6503 a46d4161213f [project @ 2007-04-06 14:57:21 by jwe] jwe parents: 6495 diff changeset	1570 %!assert(regexprep({"abc","cba"},{"b","a"},{"?","!"}),{"!?c","c?!"})
6361 776e657c9422 [project @ 2007-02-27 09:45:03 by dbateman] dbateman parents: 5866 diff changeset	1571
5785 6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1572 */
6b9cec830d72 [project @ 2006-05-03 19:32:46 by dbateman] dbateman parents: 5779 diff changeset	1573
5582 6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1574 /*
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1575 ;;; Local Variables: ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1576 ;;; mode: C++ ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1577 ;;; End: ***
6bf56668b01a [project @ 2005-12-15 01:08:20 by jwe] jwe parents: diff changeset	1578 */

Mercurial > octave-nkf

annotate src/DLD-FUNCTIONS/regexp.cc @ 8021:85184151822e